🔥OpenAI выпустили новую улучшенную Text Embedding Model: text-embedding-ada-002
1. Во первых, эта модель объединяет в себе возможности 5 старых моделей. Умеет искать текст, код, вычислять похожесть предложений и классифицировать текст: ✔️ text-similarity ✔️ text-search-query ✔️ text-search-doc ✔️ code-search-text ✔️ code-search-code
2. Новая модель она работает лучше чем старые модели на 4 из 5 бенчмарков.
3. длинна контекста увеличилась с 2048 до 8192 токенов. То есть можно загонять в нее длинные документы.
4. Размер эмбеддинга уменьшили в восемь раз. Теперь это 1536 чисел.
5. API вызов этой модели в более чем 10 раз дешевле старых, что имеет смысл, потому что она быстрее и требует меньше ресурсов.
Notion уже планирует заюзать новую модель в своем поиске.
Хочу заметить, OpenAI нашли свою бизнес модель и очень хорошо раскручиваются как поставщик API к своим жирным SOTA моделям, которые довольно трудно воспроизвести.
🔥OpenAI выпустили новую улучшенную Text Embedding Model: text-embedding-ada-002
1. Во первых, эта модель объединяет в себе возможности 5 старых моделей. Умеет искать текст, код, вычислять похожесть предложений и классифицировать текст: ✔️ text-similarity ✔️ text-search-query ✔️ text-search-doc ✔️ code-search-text ✔️ code-search-code
2. Новая модель она работает лучше чем старые модели на 4 из 5 бенчмарков.
3. длинна контекста увеличилась с 2048 до 8192 токенов. То есть можно загонять в нее длинные документы.
4. Размер эмбеддинга уменьшили в восемь раз. Теперь это 1536 чисел.
5. API вызов этой модели в более чем 10 раз дешевле старых, что имеет смысл, потому что она быстрее и требует меньше ресурсов.
Notion уже планирует заюзать новую модель в своем поиске.
Хочу заметить, OpenAI нашли свою бизнес модель и очень хорошо раскручиваются как поставщик API к своим жирным SOTA моделям, которые довольно трудно воспроизвести.
Under the Sebi Act, the regulator has the power to carry out search and seizure of books, registers, documents including electronics and digital devices from any person associated with the securities market. In this regard, Sebi collaborated with the Telecom Regulatory Authority of India (TRAI) to reduce the vulnerability of the securities market to manipulation through misuse of mass communication medium like bulk SMS. Asked about its stance on disinformation, Telegram spokesperson Remi Vaughn told AFP: "As noted by our CEO, the sheer volume of information being shared on channels makes it extremely difficult to verify, so it's important that users double-check what they read." Telegram boasts 500 million users, who share information individually and in groups in relative security. But Telegram's use as a one-way broadcast channel — which followers can join but not reply to — means content from inauthentic accounts can easily reach large, captive and eager audiences. Anastasia Vlasova/Getty Images
from us