🚀Только что выпущено новое семейство моделей генерации кода Salesforce (SFR-Embedding-Code), занявшее 1-е место на бенчмарке CoIR!
Модель доступна в в 2-х размерах: 2B, 400M.
Основные характеристики:
1️⃣ Модель 2B: Занимает первое место в CoIR.
2️⃣ Модель 400M: демонстрирует лучшие показатели среди моделей на 0,5B параметров.
3️⃣ Поддерживает 12 языков программирования,
Пример Запуска:
✅Документация
✅Модель 400M
✅ Модель 2B
📌Лицензирование моделей: CC-BY-NC-SA-4.0 License.
@ai_machinelearning_big_data
#CodeAI #MLResearch #SOTA #OpenScience #code #llm #ml
Модель доступна в в 2-х размерах: 2B, 400M.
Основные характеристики:
1️⃣ Модель 2B: Занимает первое место в CoIR.
2️⃣ Модель 400M: демонстрирует лучшие показатели среди моделей на 0,5B параметров.
3️⃣ Поддерживает 12 языков программирования,
Python, Java, C++, JavaScript, C#
и другие!Пример Запуска:
import torch.nn.functional as F
from transformers import AutoTokenizer, AutoModel
# Each query needs to be accompanied by an corresponding instruction describing the task.
query_instruction_example = "Given Code or Text, retrieval relevant content"
queries = [
"how to implement quick sort in Python?"
]
# No instruction needed for retrieval passages
passages = [
"def quick_sort(arr):\n if len(arr) <= 1:\n return arr\n pivot = arr[len(arr) // 2]\n left = [x for x in arr if x < pivot]\n middle = [x for x in arr if x == pivot]\n right = [x for x in arr if x > pivot]\n return quick_sort(left) + middle + quick_sort(right)",
"def bubble_sort(arr):\n n = len(arr)\n for i in range(n):\n for j in range(0, n-i-1):\n if arr[j] > arr[j+1]:\n arr[j], arr[j+1] = arr[j+1], arr[j]\n return arr"
]
# load model with tokenizer
model = AutoModel.from_pretrained('Salesforce/SFR-Embedding-Code-2B_R', trust_remote_code=True)
# get the embeddings
max_length = 32768
query_embeddings = model.encode_queries(queries, instruction=query_instruction_example, max_length=max_length)
passage_embeddings = model.encode_corpus(passages, max_length=max_length)
# normalize embeddings
query_embeddings = F.normalize(query_embeddings, p=2, dim=1)
passage_embeddings = F.normalize(passage_embeddings, p=2, dim=1)
scores = (query_embeddings @ passage_embeddings.T) * 100
print(scores.tolist())
✅Документация
✅Модель 400M
✅ Модель 2B
📌Лицензирование моделей: CC-BY-NC-SA-4.0 License.
@ai_machinelearning_big_data
#CodeAI #MLResearch #SOTA #OpenScience #code #llm #ml
group-telegram.com/ai_machinelearning_big_data/6575
Create:
Last Update:
Last Update:
🚀Только что выпущено новое семейство моделей генерации кода Salesforce (SFR-Embedding-Code), занявшее 1-е место на бенчмарке CoIR!
Модель доступна в в 2-х размерах: 2B, 400M.
Основные характеристики:
1️⃣ Модель 2B: Занимает первое место в CoIR.
2️⃣ Модель 400M: демонстрирует лучшие показатели среди моделей на 0,5B параметров.
3️⃣ Поддерживает 12 языков программирования,
Пример Запуска:
✅Документация
✅Модель 400M
✅ Модель 2B
📌Лицензирование моделей: CC-BY-NC-SA-4.0 License.
@ai_machinelearning_big_data
#CodeAI #MLResearch #SOTA #OpenScience #code #llm #ml
Модель доступна в в 2-х размерах: 2B, 400M.
Основные характеристики:
1️⃣ Модель 2B: Занимает первое место в CoIR.
2️⃣ Модель 400M: демонстрирует лучшие показатели среди моделей на 0,5B параметров.
3️⃣ Поддерживает 12 языков программирования,
Python, Java, C++, JavaScript, C#
и другие!Пример Запуска:
import torch.nn.functional as F
from transformers import AutoTokenizer, AutoModel
# Each query needs to be accompanied by an corresponding instruction describing the task.
query_instruction_example = "Given Code or Text, retrieval relevant content"
queries = [
"how to implement quick sort in Python?"
]
# No instruction needed for retrieval passages
passages = [
"def quick_sort(arr):\n if len(arr) <= 1:\n return arr\n pivot = arr[len(arr) // 2]\n left = [x for x in arr if x < pivot]\n middle = [x for x in arr if x == pivot]\n right = [x for x in arr if x > pivot]\n return quick_sort(left) + middle + quick_sort(right)",
"def bubble_sort(arr):\n n = len(arr)\n for i in range(n):\n for j in range(0, n-i-1):\n if arr[j] > arr[j+1]:\n arr[j], arr[j+1] = arr[j+1], arr[j]\n return arr"
]
# load model with tokenizer
model = AutoModel.from_pretrained('Salesforce/SFR-Embedding-Code-2B_R', trust_remote_code=True)
# get the embeddings
max_length = 32768
query_embeddings = model.encode_queries(queries, instruction=query_instruction_example, max_length=max_length)
passage_embeddings = model.encode_corpus(passages, max_length=max_length)
# normalize embeddings
query_embeddings = F.normalize(query_embeddings, p=2, dim=1)
passage_embeddings = F.normalize(passage_embeddings, p=2, dim=1)
scores = (query_embeddings @ passage_embeddings.T) * 100
print(scores.tolist())
✅Документация
✅Модель 400M
✅ Модель 2B
📌Лицензирование моделей: CC-BY-NC-SA-4.0 License.
@ai_machinelearning_big_data
#CodeAI #MLResearch #SOTA #OpenScience #code #llm #ml
BY Machinelearning
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/WF2SLawoJqz_URzPt-psg4eITFaPw8onril7ih0sD7ftf5ClhuBl2RL0b1ZYf5U7u1Np-_gE24L5TSyWuvb9FgaT7fUvuk_fst9iSUmpPfLQFE4nCDe70yznqHN5U0EVKtSXfRrluwfAS79DgCfwdscM8C11dS5q3wgmvXXcsBbu_G6KUtGNZ5JaxSVYIh6V4bf3mZ8YPLbsJA96dbyOA4lr8I_hOrzfUshjN2phQrY1byUmgYkuYQQW4HRf60EOaR3BGrFmu5yiblD3jy9H41KCuOYEEMNtOcK6p70lV2yP_6LJPhKbzIMvVk-BaevW3pAMj_b9mEB0sAdZ3LFAZQ.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/WvtToqbychA952OjnE3PMnNUMVeB3ErSCqisAab_AnupDFdeSDY30V1AM-XV_xAmHUk89NJclIvQYghcHT58ttJL4_ZhY_oWYyCbMkMazih_ODwN6r0JfCqVQLGkwdMp3qJ-z7kfqctyviMEEmQ1uSPmseXhvMhtkL6jD0eDWqNoukDIOvm1Etv-dnAg_qonReCH9rRdef2deUDoD593uYm-pJvAwK6BJzsXL0hWGr0zPWa9k0hCGhkOkhEu5EF7GZN94r4UDCP_4dvoAeeF1MqGH6q478-ixFVeJiyksXDlG221I5MYSsJjR7fb9FfP_dVREAty8rCkcQW9Q0R2pA.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/SgEYTyrkYjtwcq2qKAJti3RPDU21jZbbGkdPp-1AhTd1BfJL4pA3L_0NOrzPQdeE5opg5m6HRFO-v71aZWpni4AeWd9cZMruGz3OJKZoWcdzUzNSZzuXcqnefN71Y09E8Ou6Y0h0VS5Jgo4Qe7U96ubbLV8tssxN_nzd-49uh7x8A11f-zOkE-j4BAIfu0XrI3EYbA-Z5H4LN0zw8sm8g4fK4lx_MiLcupIFDBVa0c40SMtwv2NSLqoGq-BqVsPANV0xbTmJDdO5F6KIKZH3FG606XAYxuSElVNVc0MgsolKmTm8TNukTAxWC7rKU5rY2J_2ug07_kodrz1U9JK_4g.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/aToNglmYP9xidmcYge_Ky9QN-vInEGZUFl0Y1r_h9kqo-rIhDSy7RtOsc1KJ0yhXJC-Fpw3Gm0GQqSH7mgK2RYCZ4S_sSb03L72gwAl2fjtF5zVdFiRbekpdgFueL38b22hrW8uYmOqndtaSMJW2xdrUc6N0nRLMxSq3tg9ijXprFHp8m3DL-wDyVZ1T7xwLFvAVGP1C720-Rz2rcjFfE8he1kBCxD8SKl5oPYwD1BM4zivBeck5A-mL3SnG5bBmjlvSkkXqfPvRPSTLPTTGfP_IdqcRHLa0Rp2JsI4GhkBAMWNSuFhb7XQbfhmaHV9ojDyYw3emjU8aFsSfdO44iA.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/un-KF1fyq57iqZY4WBzo-WMYudJ9QuZwgm4OEQLUXfD3SE8Se5ZcO6CCW3dIXfPHpiNovLyzbjpq27e8bisTU04gfVX1IzFCIwHE0G3rN7vhuJdjFZ4WhRQ2Npw0uizxCV88qpy-CONrELLIy7xJpYCkPQgeAHlBYYI-193MzWh-lLuR0VbPdRhDdAiezw4K0UmxfeCmWILYXQ9WPA9hZG5mfLiKwKYDgSleLRrcPDBEcu1U7QBUJAwTixKjGLQ61B-euVVhCzjsFTsWkyDpGzPO1eXnc_Rs4AhyDZKu5LwHQG3rOUiPNlMgq3pSqytoWj5GpfMyYWaVrEII1PmkgA.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/ifBwLglEuV8MqJcEJ-rBYSiBpGl1UeBU5_uWixMjrKKu2bVndm_3SyKDuye_EF5rAHuoW2RDB4HRGqEiNgv-RKhTiwppBCveXjxpWs8KedWScXsU0FlENQYVm1eegZ5bQ3mFiFPF5FqRrwpJs3UMCguwBCJ_U_MiHnwKl6PuL0TRL_WWXhdoPwrZzXNg3PpXFSP6LeoTCNoalK11od_8xTEoVvLiSeo875ODNb-GbFHU5yXwh5AvI0kDZkvByC0Ekq-swXKnpfry_GGRlrlLiCjsRUxKG2LuiFxzY63WQPXZ0Pr8MHDGtjuyqcBUjnvoLYRAB1XoODHRiUVFvjWD5w.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/E5oouHCiJTmO6CP9I7CUSf6hUA1qtDhcTtG_ZEMA9I1yJixWv1cbGXPQG8EzxcGZZ-AnbL50598PavCo_RAb9cBZbdKZcLus8YzKIs66cgg1EKxfXwJSl1du5pA70AC9oVUE5VMnZcgsQnjyJjqQjkVH1o8vX5I3djwJu6vttnMzRM-PEruD2hZzpuv-a_5wWOmbfNl5mHM3a253vz7dE-5HpFgllB0cGbXRrMH0m2Kv8YaobLIPDDOp92-bUcX4FIwjKoYKMHBAcvTpHmb6kmAprxUV299VlKdj7w1VFuvOdgtg1d-BOXzWeJIGq0OiD2gvbzxuVJUfJnuoDGPnAQ.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/eZ6PM09SqpT0qwfsQ7VBTBVU91GMomFinNTwUVBwYRuD0GLq8SaC2iM4atHSWxeIHs7A9g4Hjoe1uQSBZtfl_4Fj_k37jpSdFyRM8Pzn437rJv_65tF3ZqV0rw-3yYQebxCsXiSkdGKISSn5E8imU7EoZiW8gpETGlLiuqamC3tjOIYFMArBIAa1rQP_3vopovRx618QUt_FzUG64PaFNK6UN2IpvSeOuNKKKvBTxFdyL2rW5T7QW_JipghAr6gtbOmSA2_ELkG7kElVBCp_3vvs3sVGH0D0aGMHHXR45UqYnqxjzkbvEdCDq0lxxxPhTVbGEtNUMR9LmAdWvM6_aQ.jpg)
Share with your friend now:
group-telegram.com/ai_machinelearning_big_data/6575