group-telegram.com/ai_newz/2768
Last Update:
На презентации AMD рассказали не только дату релиза SD3, я выбрал для вас самые интересные анонсы.
➖Пообещали выпускать по новой видеокарте для датацентров каждый год и рассказали о спецификациях датацентровых GPU выходящих в следующие два года.
➖MI325X - новая GPU с 288 гигабайтами памяти и заметно быстрее H200. Одна машина с восемью такими видеокартами может запускать модели на триллион параметров. На бумаге туда влезает вплоть до двух триллионов (у оригинальной GPT-4 было 1.8T), но софт пока что не поддерживает их имплементацию fp8. Выйдет в четвёртом квартале. Заметно небольшое отставание в таймлайнах от главного конкурента, H200, которых начали поставлять первым клиентам уже месяц назад.
➖MI350 – конкурент B200. Будет поддержка fp6 и fp4. Обещают 1.5x памяти и 1.5x производительности по сравнению с B200. Релиз в следующем году.
➖Заявили участие в новом открытом стандарте нетворкинга, Ultra Accelerator Link. Он будет аналогом NVLink, скейлящимся на сотни устройств. Разрабатывается консорциумом из Google, Meta, Broadcom, Microsoft, Intel, AMD, HPE и Cisco.
➖Сатья Наделла и CEO Stability рассказали, как им нравятся MI300x, выпущенные в прошлом году. Stability они позволили апскейлинг изображений до сотни мегапикселей, а для Microsoft наиболее дешёвый инференс GPT-4.
➖Анонсировали процессоры для десктопов и ноутбуков с новым поколением NPU - 50 TOPS в новом формате Block FP16. Заявляют что у нового формата практически нет потери качества, и он заметно быстрее. Демонстрировали это на SDXL, которая в int8 рассыпалась, а у Block FP16 и обычного FP16 результаты были одинаковые.
Стоит учитывать, что это AMD и софт там перманентно в очень плохом состоянии.
Полную презу можно глянуть тут.
@ai_newz