NVIDIA представила самый мощный чип в мире — Blackwell B200, который откроет путь к гигантским нейросетям

Компания Nvidia в рамках конференции GTC 2024 представила ИИ-ускорители следующего поколения на графических процессорах с архитектурой Blackwell. По словам производителя, грядущие ИИ-ускорители позволят создавать ещё более крупные нейросети, в том числе работать с большими языковыми моделями (LLM) с триллионами параметров, и при этом будут до 25 раз энергоэффективнее и экономичнее в сравнении с Hopper.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Архитектура GPU Blackwell получила название в честь американского математика Дэвида Блэквелла (David Harold Blackwell) и включает в себя целый ряд инновационных технологий для ускорения вычислений, которые помогут совершить прорыв в обработке данных, инженерном моделировании, автоматизации проектирования электроники, компьютерном проектировании лекарств, квантовых вычислениях и генеративном ИИ. Причём на последнем в Nvidia делают особый акцент: «Генеративный ИИ — это определяющая технология нашего времени. Графические процессоры Blackwell — это двигатель для новой промышленной революции», — подчеркнул глава Nvidia Дженсен Хуанг (Jensen Huang) в рамках презентации.

Графический процессор Nvidia B200 производитель без лишней скромности называет самым мощным чипом в мире. В вычислениях FP4 и FP8 новый GPU обеспечивает производительность до 20 и 10 Пфлопс соответственно. Новый GPU состоит из двух кристаллов, которые произведены по специальной версии 4-нм техпроцесса TSMC 4NP и объединены 2,5D-упаковкой CoWoS-L. Это первый GPU компании Nvidia с чиплетной компоновкой. Чипы соединены шиной NV-HBI с пропускной способностью 10 Тбайт/с и работают как единый GPU. Всего новинка насчитывает 208 млрд транзисторов.

 Один из кристаллов GPU Blackwell

Один из кристаллов Blackwell — в GPU таких кристаллов два

По сторонам от кристаллов GPU расположились восемь стеков памяти HBM3E общим объёмом 192 Гбайт. Её пропускная способность достигает 8 Тбайт/с. А для объединения нескольких ускорителей Blackwell в одной системе новый GPU получил поддержку интерфейса NVLink пятого поколения, которая обеспечивает пропускную способность до 1,8 Тбайт/с в обоих направлениях. С помощью данного интерфейса (коммутатор NVSwitch 7.2T) в одну связку можно объединить до 576 GPU.

Одними из главных источников более высокой производительности B200 стали новые тензорные ядра и второе поколение механизма Transformer Engine. Последний научился более тонко подбирать необходимую точность вычислений для тех или иных задач, что влияет и на скорость обучения и работы нейросетей, и на максимальный объём поддерживаемых LLM. Теперь Nvidia предлагает тренировку ИИ в формате FP8, а для запуска обученных нейросетей хватит и FP4. Но отметим, что Blackwell поддерживает работу с самыми разными форматами, включая FP4, FP6, FP8, INT8, BF16, FP16, TF32 и FP64. И во всех случаях кроме последнего есть поддержка разреженных вычислений.

Флагманским ускорителем на новой архитектуре станет Nvidia Grace Blackwell Superchip, в котором сочетается пара графических процессоров B200 и центральный Arm-процессор Nvidia Grace с 72 ядрами Neoverse V2. Данный ускоритель шириной в половину серверной стойки обладает TDP до 2,7 кВт. Производительность в операциях FP4 достигает 40 Пфлопс, тогда как в операциях FP8/FP6/INT8 новый GB200 способен обеспечить 10 Пфлопс.

Как отмечает сама Nvidia, новинка обеспечивает 30-кратный прирост производительности по сравнению с Nvidia H100 для рабочих нагрузок, связанных с большими языковыми моделями, а она до 25 раз более экономична и энергетически эффективна.

Ещё Nvidia представила систему GB200 NVL72 — фактически это серверная стойка, которая объединяет в себе 36 Grace Blackwell Superchip и пару коммутаторов NVSwitch 7.2T. Таким образом данная система включает в себя 72 графических процессора B200 Blackwell и 36 центральных процессоров Grace, соединенных NVLink пятого поколения. На систему приходится 13,5 Тбайт памяти HBM3E с общей пропускной способностью до 576 Тбайт/с, а общий объём оперативной памяти достигает 30 Тбайт.

Платформа GB200 NVL72 работает как единый GPU с ИИ-производительностью 1,4 эксафлопс (FP4) и 720 Пфлопс (FP8). Эта система станет строительным блоком для новейшего суперкомпьютера Nvidia DGX SuperPOD.

На переднем плане HGX-система с восемью Blackwell. На заднем — суперчип GB200

Наконец, Nvidia представила серверные системы HGX B100, HGX B200 и DGX B200. Все они предлагают по восемь ускорителей Blackwell, связанных между собой NVLink 5. Системы HGX B100 и HGX B200 не имеют собственного CPU, а между собой различаются только энергопотреблением и как следствие мощностью. HGX B100 ограничен TDP в 700 Вт и обеспечивает производительность до 112 и 56 Пфлопс в операциях FP4 и FP8/FP6/INT8 соответственно. В свою очередь, HGX B200 имеет TDP в 1000 Вт и предлагает до 144 и 72 Пфлопс в операциях FP4 и FP8/FP6/INT8 соответственно.

Наконец, DGX B200 копирует HGX B200 в плане производительности, но является полностью готовой системой с парой центральных процессоров Intel Xeon Emerald Rapids. По словам Nvidia, DGX B200 до 15 раз быстрее в задачах запуска уже обученных «триллионных» моделей по сравнению с предшественником.

Для создания наиболее масштабных ИИ-систем, включающих от 10 тыс. до 100 тыс. ускорителей GB200 в рамках одного дата-центра, компания Nvidia предлагает объединять их в кластеры с помощью сетевых интерфейсов Nvidia Quantum-X800 InfiniBand и Spectrum-X800 Ethernet. Они также были анонсированы сегодня и обеспечат передовые сетевые возможности со скоростью до 800 Гбит/с.

Свои системы на базе Nvidia B200 в скором времени представят многие производители, включая Aivres, ASRock Rack, ASUS, Eviden, Foxconn, GIGABYTE, Inventec, Pegatron, QCT, Wistron, Wiwynn и ZT Systems. Также Nvidia GB200 в составе платформы Nvidia DGX Cloud, а позже в этом году решения на этом суперчипе станут доступны у крупнейших облачных провайдеров, включая AWS, Google Cloud и Oracle Cloud.

Google будет обучать ИИ на постах с Reddit — это обойдётся ей в $60 млн в год

Администрация сетевого сообщества Reddit заключила сделку с Google и согласилась предоставить свой контент для обучения моделей искусственного интеллекта, сообщает Reuters со ссылкой на три собственных источника. Сделка оценивается примерно в $60 млн в год, добавил один из источников.

 Источник изображения: Brett Jordan / unsplash.com

Источник изображения: Brett Jordan / unsplash.com

Reddit, которая готовится выйти на биржу, стремится обеспечить себе новые источники доходов в условиях жёсткой конкуренции с TikTok и Facebook? на рынке цифровой рекламы. Компания готовится к этому шагу уже более трёх лет, и для подачи заявления на первичное размещение акций (IPO) ей потребуется подробно расписать инвесторам свои финансовые показатели. В минувшем году Reddit ввела плату за доступ к API — средствам доступа к контенту через стороннее ПО. Соглашение с Google стало первой сделкой с крупным игроком в области ИИ.

В ходе раунда финансирования в 2021 году Reddit была оценена в $10 млрд, а в рамках IPO она намеревается продать около 10 % своих акций. Размещение активов платформы на бирже станет первым IPO крупной соцсети с 2019 года, когда стартовала торговля акциями Pinterest.

Разработчики моделей ИИ заключают соглашения с владельцами контента в стремлении диверсифицировать данные за пределами общедоступных ресурсов интернета. При подборе массивов обучающих данных приходится решать вопросы с авторскими правами — юридическая практика в этой области не сложилась до сих пор.

Платформа Reddit запущена в 2005 году веб-разработчиком Стивом Хаффманом (Steve Huffman) и предпринимателем Алексисом Оганяном (Alexis Ohanian). Она известна разнообразными дискуссионными группами, некоторые из которых насчитывают десятки миллионов участников.

Baldur’s Gate 3 стала первой новой игрой после Elden Ring, получившей в Steam более полумиллиона обзоров от пользователей

Несмотря на бесчисленное множество популярных игр в Steam, более полумиллиона пользовательских обзоров из них получили меньше трёх десятков. Недавно к их числу присоединилась Baldur’s Gate 3 — фэнтезийная RPG от Larian Studios.

 Источник изображения: Steam (mg-mat)

Источник изображения: Steam (mg-mat)

Как отмечает PC Gamer, технически Baldur’s Gate 3 преодолела отметку в 500 тыс. отзывов до этой недели, однако при подсчёте обзоров Valve не учитывает отклики от пользователей, купивших игру не через Steam.

Суммарно Baldur’s Gate 3 получила уже более 560 тыс. пользовательских рецензий и вышла на 25-е место по этому показателю в истории Steam, став первой новой игрой после Elden Ring, попавшей в топ-30 (Lethal Company на 40-й строчке).

При этом бо?льшую часть обзоров Baldur’s Gate 3 получила именно после выхода из раннего доступа: к началу прошлого августа (версия 1.0 вышла 3-го числа) игра насчитывала около 42 тыс. рецензий в Steam.

 Источник изображения: Steam

Источник изображения: Steam

Глава издательского отдела Larian Майкл Даус (Michael Douse) поблагодарил фанатов за покорение этой вершины: «Помню, как лет девять назад просматривал игры с таким числом обзоров и думал, какое же это безумие. А теперь этого показателя достигли мы…»

«Полмиллиона — очень большое число. Хотел бы я собрать вас всех в одном месте, пожать вам руки и поговорить про пережитые приключения. В отсутствие такой возможности скажу, что читать эти обзоры было сплошным удовольствием», — поделился глава Larian Свен Винке (Swen Vincke).

За полгода с выхода из раннего доступа процент позитивных обзоров Baldur’s Gate 3 в Steam достиг 96 % («крайне положительные» отзывы). Со дня на день игра должна получить шестой крупный пострелизный патч.

ФБР уничтожило шпионский ботнет и обвинило в его создании российскую разведку

Американские власти заявили об уничтожении ботнета, который использовался для фишинговых атак, шпионажа, сбора учётных данных и кражи информации — по их версии, к развёртыванию сети взломанных устройств причастны структуры российской разведки. Об этом сообщает The Register.

 Источник изображения: David Trinks / unsplash.com

Источник изображения: David Trinks / unsplash.com

Ботнет был ликвидирован в январе — его составили «более тысячи» маршрутизаторов, используемых в домашних сетях и сетях малых предприятий. Устройства были заражены вирусом Moobot — одним из вариантов ранее выявленного вредоноса Mirai. Вирус использовался для удалённого управления взломанными устройствами и проведения атак на сети.

Установку Moobot на маршрутизаторы под управлением Ubiquiti Edge OS произвели неизвестные киберпреступники, воспользовавшись установленными по умолчанию учётными данными. После этого управление взломанными устройствами, по версии ФБР, перехватила хакерская группировка APT 28, также известная под названиями Forest Blizzard и Fancy Bear, которая якобы связана с российской разведкой. Эта группировка посредством массовой установки на устройства собственных скриптов перепрофилировала ботнет и превратила его «в глобальную платформу кибершпионажа». Целями ботнета были организации, связанные с правительствами США и других стран, военные организации и частные компании.

Эксперты ФБР перехватили управление Moobot и отдали вредоносной сети команду на копирование и удаление вредоносных файлов, включая файлы самого вредоноса, а также данных, которые содержались на взломанных маршрутизаторах. Американцы изменили правила сетевого экрана маршрутизаторов, предотвратив их повторный захват. В конце операции все устройства были принудительно сброшены к заводским настройкам — это значит, что при сохранении установленных по умолчанию учётных данных они останутся уязвимыми для повторных атак.

Sony PlayStation 5 Pro будет в три раза быстрее PS5 и выйдет к концу года

Sony работает над игровой приставкой PlayStation 5 Pro, которая получит значительно более производительный графический процессор — в три раза быстрее, чем на существующих моделях PS5. Об этом сообщили YouTube-канал Moore’s Law is Dead и подтвердил Том Хендерсон (Tom Henderson) с портала Insider Gaming. Выход консоли намечен на конец 2024 года.

 Источник изображения: Kerde Severin / unsplash.com

Источник изображения: Kerde Severin / unsplash.com

Скриншот технического документа гласит, что теоретическая производительность системы составит 67 Тфлопс (FP16) или 33,5 Тфлопс при одинарной точности (FP32). При этом существующая PS5 демонстрирует производительность в 10,28 Тфлопс, так что графическая подсистема новой модели окажется втрое быстрее. Сообщается, что прирост производительности при рендеринге составит 45 %. PS5 Pro также обещает трёхкратный рост производительности в трассировке лучей — в отдельных случаях до четырёхкратного.

В документах, которые, как сообщается, были опубликованы на внутреннем портале Sony, также упоминается технология PlayStation Spectral Super Resolution (PSSR). Речь идёт о технологии масштабирования изображения с помощью ИИ, аналогичной Nvidia DLSS и AMD FSR. Она позволит увеличивать разрешение до 8K и повышать скорость работы при трассировке лучей.

YouTube-канал Moore’s Law is Dead не всегда был надёжным источником информации, отмечает The Verge, но его сведения подтверждает Insider Gaming. Сотрудники принадлежащих Sony студий тестируют комплекты для разработки PS5 Pro уже с сентября, а сторонние студии получили к ним доступ в январе. В продажу новая приставка может поступить в ноябре.

В плагинах ChatGPT нашли уязвимости, позволявшие взламывать учётные записи на сторонних платформах

Компания Salt Security обнаружила в некоторых плагинах ChatGPT критические уязвимости, через которые злоумышленники могли получать несанкционированный доступ к учётным записям пользователей на сторонних платформах. Речь идёт о плагинах, позволяющих ChatGPT выполнять такие операции, как, например, правка кода на GitHub или получение данных с «Google Диска».

 Источник изображения: ilgmyzin / unsplash.com

Источник изображения: ilgmyzin / unsplash.com

Плагины ChatGPT — это альтернативные версии чат-бота на основе искусственного интеллекта, и публиковать их может любой разработчик. Эксперты Salt Security обнаружили три уязвимости. Первая касается процесса установки плагина — ChatGPT отправляет пользователю код подтверждения установки, но у злоумышленников есть возможность подменять его кодом для установки вредоносного плагина.

Вторая уязвимость обнаружена на платформе PluginLab, которая используется для разработки плагинов ChatGPT, — здесь отсутствовала достаточная защита при аутентификации пользователей, в результате чего хакеры могли перехватывать доступ к их учётным записям. Одним из плагинов, которые затронула эта проблема, был AskTheCode, предусматривающий интеграцию ChatGPT и GitHub.

Третья уязвимость обнаружилась в нескольких плагинах, и в её основу легли манипуляции с перенаправлениями при авторизации через протокол OAuth. Она тоже позволяла перехватывать доступ к учётным записям на сторонних платформах. Плагины не имели механизма проверки URL-адресов при перенаправлении, что позволяло злоумышленникам отправлять пользователям вредоносные ссылки для кражи их аккаунтов.

Salt Security заверила, что следовала стандартной процедуре и уведомила о своих открытиях OpenAI и другие стороны. Ошибки были исправлены оперативно, и свидетельств о наличии эксплойтов обнаружить не удалось.

Samsung представила 200-долларовый смартфон Galaxy F15 с экраном AMOLED, 50-Мп камерой и батареей на 6000 мА·ч

Компания Samsung представила бюджетный смартфон Galaxy F15, который выделяется ёмкой батареей на 6000 мА·ч. Кроме того, смартфон получил AMOLED-дисплей и довольно производительный процессор.

 Источник изображения: Samsung

Источник изображения: Samsung

В основе Galaxy F15 используется процессор MediaTek Dimensity 6100+ (два ядра Cortex-A76 с частотой 2,2 ГГц, шесть ядер Cortex-A55 с частотой 2,0 ГГц и графическое ядро Mali-G57 MC2). Смартфон предлагает 4 или 6 Гбайт оперативной, а также 128 Гбайт постоянной памяти. Есть поддержка карт памяти microSDXC. Правда, в этом случае занимается второй разъём для SIM-карты. Новинка оснащена 6,6-дюймовым AMOLED-дисплеем с разрешением 2340 × 1080 пикселей, частотой обновления 90 Гц и обладает яркостью 800 кд/м2.

На передней панели смартфона расположена фронтальная камера разрешением 13 Мп. Она поддерживает запись видео в 1080p при 30 кадрах в секунду. Основной блок камер состоит из трёх модулей. Главным является 50-Мп сенсор с оптикой f/1.8. В помощь к нему выделены 5-Мп датчик с широкоугольной оптикой f/2.2, а также 2-Мп сенсор для макросъёмки. Для основной камеры заявляется поддержка автофокуса и возможность съёмки видео формата 1080p@30fps.

Как уже говорилось выше, Galaxy F15 получил батарею ёмкостью 6000 мА·ч. Она поддерживает зарядку мощностью 25 Вт, однако в комплекте поставки смартфона блок питания не предусмотрен.

Galaxy F15 не имеет модуля NFC, но оснащён 3,5-мм аудиовыходом. Работает новинка под One UI 6.0 на базе Android 14. Из дополнительных возможностей можно выделить наличие сканера отпечатков пальцев и поддержку 5G. В целом устройство по характеристикам очень похоже на ранее выпущенную модель Galaxy A15 5G, но получило более ёмкую батарею.

Версия Galaxy F15 с 4 Гбайт ОЗУ и 128 Гбайт постоянной памяти оценивается примерно в $195, а вариант с 6 Гбайт ОЗУ и 128 Гбайт постоянной памяти — в $205. Предварительные продажи начинаются с сегодняшнего дня. Формальный старт продаж запланирован на 11 марта.

Рекламодатели переметнутся к конкурентам в случае запрета TikTok в США

Рекламодатели, которые для выхода на молодую аудиторию продвигают свои товары и услуги в TikTok, разрабатывают планы ухода на конкурирующие платформы на случай, если закон о принудительном отчуждении платформы вступит в силу, и она перейдёт к новому владельцу или будет запрещена в США. Сейчас они ждут сигналов от Сената о его дальнейших действиях — это повлияет на маркетинговые бюджеты компаний.

 Источник изображения: Solen Feyissa / unsplash.com

Источник изображения: Solen Feyissa / unsplash.com

Эксперты по рекламе уверены, что крупнейшими выгодоприобретателями нового закона станут Meta? Reels и YouTube Shorts как основные конкуренты TikTok. Внесённый в Палату представителей законопроект воспринимается как наиболее значительная за всё время угроза платформе, и рекламодатели внимательно следят за развитием событий. Рекламные агентства рекомендуют своим клиентам не спешить со сменой стратегии в отношении TikTok — США в той или иной форме пытаются ограничить его работу с 2020 года.

Рекламные бюджеты планируются на несколько месяцев вперёд, но контент бренды размещают оперативно, реагируя на актуальную повестку. Видео в TikTok может быстро задать тенденции в музыке и индустриях моды и красоты, поэтому платформа привлекает бренды, которые надеются стать частью важных культурных событий. В этом году рекламная выручка платформы в США составит $8,66 млрд, подсчитали аналитики Insider Intelligence. Учитывая, насколько высоки ставки, полный запрет такой платформы в США представляется маловероятным, считают эксперты, но предполагаемый законопроектом шестимесячный срок даст рекламодателям время подготовиться.

Даже если маркетинговые бюджеты будут перенаправлены на Reels и Shorts, нет никакой гарантии, что эффективность от этих платформ будет сравнима с показателями TikTok — отсутствует уверенность, что пользователи китайской соцсети будут стекаться сюда.

ADATA представила покрытие для высокоскоростных модулей памяти DDR5, которое снизит их температуру на 10 %

Компания ADATA представила новое покрытие для высокоскоростных модулей памяти, которое обеспечит снижение их температуры. Оно впервые появится в модулях DDR5-8000, выпускающихся под брендом XPG. По словам производителя, это покрытие способно снизить рабочую температуру чипов памяти на 10 %. На практике это означает снижение температуры примерно на 8,5 градусов Цельсия.

 Источник изображений: ADATA

Источник изображений: ADATA

«В разгоняемых модулях памяти XPG применяется новая технология термического покрытия, которая эффективно снижает их рабочую температуру на 10 %. […] Реальные тесты показывают снижение температуры на 8,5 градусов Цельсия у разогнанных модулей ОЗУ DDR5 с технологией теплоотводящего покрытия печатной платы по сравнению со стандартной разогнанной памятью, а также повышенную эффективность рассеивания тепла на 10,8 %», — говорится в пресс-релизе ADATA.

Покрытие обеспечивает дополнительную площадь для рассеивания тепла и в сочетании с радиатором обеспечивает более эффективное охлаждение модулей памяти. ADATA планирует использовать эту технологию в своих самых скоростных модулях ОЗУ со скоростью передачи данных 8000 МТ/с и выше.

Производитель предоставил изображение, на котором показана работа нового термопокрытия на модуле памяти без установленного радиатора на фоне такого же модуля ОЗУ без радиатора и нового покрытия. Компания не уточнила скорость модуля памяти.

В пресс-релизе производителя говорится, что первые модули ОЗУ с новым термопокрытием появятся в продаже во втором квартале этого года. Ближе к выставке Computex 2024, которая состоится летом этого года, компания представит с таким же термпокрытием модули памяти из серий LANCER NEON RGB и LANCER RGB.

Lian Li показала L-образный блок питания Edge на 1300 Вт для корпусов с двумя отсеками

Lian Li продемонстрировала на выставке Digital Expo 2024 несколько своих будущих продуктов, в том числе серию блоков питания Edge в L-образном исполнении. Идея в том, чтобы упростить доступ к портам питания — это пригодится, когда в корпусе достаточно места для блока питания, но возникают проблемы при подключении новых кабелей.

 Источник изображений: Lian Li

Источник изображений: Lian Li

Инновационная конструкция разработана для корпусов с двумя отсеками, где решающее значение имеет прокладка кабелей. L-образное исполнение обеспечивает свободный доступ к каждому разъёму в боковой части корпуса, и кабели при прокладке уже не путаются. Lian Li уверяет, что блоки питания Edge будут совместимы с большинством стандартных корпусов, но акцент делается на двухкамерную конструкцию, на которой останавливают выбор энтузиасты, и которую активно продвигает сам производитель.

Блок питания оборудован встроенным USB-концентратором с расширенным доступом ко внутренним USB-разъёмам — нет необходимости прокладывать кабели для каждого индивидуально. Lian Li уточнила, что модель на 1300 Вт имеет сертификат 80 Plus Platinum, а в перспективе выйдут модели 80 Plus Gold мощностью 1000 и 850 Вт. Они будут соответствовать стандартам питания ATX 3.0 и позволят подключать 600-Вт кабель 12VHWPR для мощной видеокарты. Модель Edge1300 появится в чёрном и белом исполнении.