Telegram Group Search
К концу 2025 класс юриста будет на 90% определяться классом его ИИ-ассистента.
Модели рассуждений совершили прорыв в квалификации навыков и производительности юридической практики.
Первое рандомизированное контролируемое исследование, оценивало выполнение студентам-юристам старших курсов шести юридических задач с использованием:
- юридического инструмента ИИ на основе RAG (Vincent AI),
- модели рассуждений ИИ (O1-preview OpenAI)
- или без ИИ (как это привычно делают и по сей день юристы всего мира).

Исследование показало:
• Оба инструмента ИИ значительно повысили качество юридической работы.
Помощь ИИ значительно повышает производительность в пяти из шести протестированных юридических задач, причем:
- Vincent дает статистически значимый прирост примерно от 38% до 115%
- o1-preview увеличивает производительность от 34% до 140%, с особенно сильным эффектом в сложных задачах, таких как составление убедительных юридический писем и анализ юридических жалоб.
• Использование моделей рассуждений улучшают не только ясность, организацию и профессионализм юридической работы, но также глубину и строгость самого юридического анализа.
• Количество галлюцинаций оказалось крайне невелико. А у Vincent AI оно было примерно таким же, как и у студентов-юристов, которые вообще не использовали ИИ (увы, но и люди склонны к конфабуляциям).
• Полученные результаты резко контрастируют с предыдущими исследованиями, изучавшими старые большие языковые модели, такие как GPT-4.
Иными словами, произошел прорыв, связанный с появлениям у моделей способности рассуждать.

Главных выводов два.
1. Результаты исследования убедительно показали, что интеграция возможностей RAG, специфичных для предметной области, с моделями рассуждений даёт прорывное синергетическое улучшение уровня юридической компетенции и производительности труда.
2. Такие результаты не только знаменуют очень скорый приход следующего поколения юридических инструментов на основе ИИ, но и кардинально изменит будущее адвокатуры в целом.

#LLMvsHomo
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from КОМПЬЮТЕРРА
На «Госуслугах» появится внутренний дейтинг-сервис в рамках нацпроекта «Семья»

Пользователи смогут искать пары и знакомиться прямо внутри «Госуслуг». Алгоритм будет подбирать пару на основе более чем сотни критериев, включая отчисления в ФНС, судимости, количество недвижимости, наличие детей и количество разводов.

Если человек три года не платил налоги, его анкета может выпадать реже, а если у него за плечами два развода — появится специальная отметка «Опытный семьянин».

Одна из ключевых функций — геолокация. Если в радиусе 300 метров появится потенциально совместимый партнер, пользователь получит уведомление: «Ольга. 300 метров от вас. Официально трудоустроена в магазине разливного пива».

Полную новость читайте на сайте.

☁️ Подписаться на канал
Please open Telegram to view this post
VIEW IN TELEGRAM
📱Жители Татарстана смогут участвовать в судебных заседаниях в онлайн-режиме

Жители Татарстана получат возможность участвовать в судебных заседаниях дистанционно. По информации главы регионального Минюста Рустема Загидуллина, в проекте, начиная с этого года, примут участие более 50 судебных участков.

По его словам, Татарстан стал первым регионом, где тестируют возможность участия людей в заседаниях через веб-конференцию. Соответствующее соглашение подписали на международном форуме Kazan Digital Week 2024.

Он также уточнил, что участвовать в заседаниях можно будет, как с помощью компьютера, так и через мобильное устройство.
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Адвокатские войны (Сергей Наумов)
Алиса, напиши иск...

Год назад примерно в этих же числах я рассказывал одному адвокату о том, в чём плюсы проекта А2Чацкий. Вместе со студентом Мытищинского техникума Иваном Сергеевичем мы пытались путём комбинации нейронок на платформе Coze сделать помощника адвоката, ну так, чтобы мог писать простые ходатайства, например, об ознакомлении с делом и т. п. Рассказывал об этом коллегам на форуме в Воронеже, скорее в целях пропаганды, чтобы сами пробовали.

Так вот, уже тогда адвокаты твёрдо и чётко дали понять: единственное, что реально интересно, это если софтина сама будет писать иски и апелляционные жалобы. Качественно.

Примерно где-то в августе прошлого года коллега из Новосибирска просил использовать нейронку для анализа судебного акта. С разбором документа нейронка справилась на тройку с плюсом, лишь подтвердила выводы, к которым пришёл эксперт-человек.

И мы примерно в это же время поспорили с Иваном Сергеевичем, сколько времени потребуется нейронкам, чтобы писать так, чтобы я у них начал списывать. Моя ставка на пять лет, Иван существенно оптимистичнее — до конца 2025 года.

По факту получилось ещё раньше, спор я посчитал что проиграл. За последнее время мне несколько адвокатов из разных регионов подтвердили факт существенного прорыва в написании мотивировок.

Открыто признаю, что по-серьёзному я сам использовал нейронки всего лишь в двух процессах за последние две недели.

В Измайловском районном суде г. Москвы и сегодня, 5 июня 2025 г., в апелляционном суде в защите Марьина С. Т.

Возможно, ещё пару месяцев, и ажиотаж использования нейронок практикующими юристами (не только студентами) спадёт. Никто же из юристов не хвастается сегодня тем, что он использует для работы «КонсультантПлюс» + «Гарант».

Это уже отраслевой стандарт. Вопрос в другом. Какие нейронные сети в России станут отраслевым стандартом?

Я лично пока вижу, что для меня таким стандартом становятся американские нейронки, и в моей рубрике #попугаеметр на этой неделе соревнуются Gemini и Grok.

Вот на этом абзаце и остановлюсь, потому что сейчас, если начать вспоминать про GigaChat и Яндекс, то можно будет получить учётную запись «Дискредитирует» вслед на Марьиным.

Оставлю эти свои невысказанные рассуждения для печати в «Праворубе».

Не то чтобы я рассчитываю там найти массу единомышленников, мне лично надолго отбило желание что-то писать в «Праворубе» хамство белгороцкого Бориса «Ферзь» Золотухина.

С другой стороны, зависть и ненависть со стороны каких-то функционеров — это ведь тоже сильный сигнал в пользу дееспособности идей.

В частности, тех, что надо добиваться от законодателей гарантий и прав юристов (адвокатов) на сильное шифрование и цифровую независимость (в том числе экстерриториальность).

Если мне для защиты прав граждан нужны зарубежные нейронки, я должен иметь право импорта. Думаю, в этом со мной будут солидарны многие адвокаты. Функционеров в расчёт не беру, эти солидарны в том, чтобы негодяйствовать.

#юридические_БЯМки
This media is not supported in your browser
VIEW IN TELEGRAM
Как я добрался до GitHub ...

Заказал младшему антинаучному посадочную страницу сайта «Адвокатский софт». Пришлось регистрироваться на GitHub. Символично, что в День русского языка. Долго возился с выбором лицензии для проекта. Как оказалось, для юристов там есть что почитать. Пришлось призвать в помощь детище Маска. Смотрите сами, а если смотрилка не работает, я могу подсказать, где взять штуку из трёх букв. Пишите.

#GitHub для адвоката
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Grok
Векторная база данных — это тип базы данных, который хранит и обрабатывает данные в виде векторов, то есть числовых массивов, представляющих объекты (например, тексты, изображения) в многомерном пространстве. Для юриста это можно объяснить так: представьте, что каждый документ, договор или судебное решение превращается в набор чисел, описывающих его содержание (смысл, ключевые слова, контекст). Эти числа позволяют компьютеру быстро находить похожие документы, даже если они не содержат одинаковых слов.

Пример: Вы ищете судебные решения, похожие на ваш кейс. Векторная база данных сравнивает "числовой отпечаток" вашего дела с отпечатками других решений и выдаёт наиболее близкие по смыслу, а не только по точному совпадению слов.

Зачем юристу?
- Быстрый поиск схожих дел или документов.
- Анализ больших объёмов текстов (например, контрактов) для выявления паттернов.
- Автоматизация проверки документов на соответствие или риски.

Это как библиотекарь, который мгновенно находит книги не по названию, а по их содержанию, даже если вы описали его своими словами.
Forwarded from GigaChat
Представьте себе библиотеку, в которой хранится огромное количество книг — каждая книга уникальна и представляет собой отдельную единицу информации. Но вместо того, чтобы хранить эти книги в алфавитном порядке или по тематике, мы используем систему координат, где каждой книге присваивается определённое местоположение в пространстве.

Теперь представьте, что вам нужно быстро найти книгу, содержание которой соответствует вашим интересам, даже если вы точно не знаете её название или автора. Для этого достаточно задать запросы вроде: «Покажите мне материалы по наследственному праву», «Какие решения были приняты судом по трудовым спорам?» или «Где описаны случаи банкротства крупных компаний?»

Именно такую роль играет векторная база данных: она позволяет эффективно искать нужную информацию, используя сопоставление смысловых признаков текста. Вместо традиционного индексирования по ключевым словам эта система создаёт своего рода карты смыслов, позволяя находить релевантные данные быстрее и точнее.

Таким образом, для юриста такая технология помогает существенно ускорить процесс поиска нужной судебной практики, нормативных актов или правовых материалов путём сопоставления запросов с содержимым документов на уровне смысла, а не буквального совпадения ключевых слов.
Сравните два ответа о том, что такое векторная база данных, чтобы юрист понял. Кто лучше: Grok или GigaChat?
Anonymous Poll
67%
Grok
33%
GigaChat
Адвокатский Софт pinned «Сравните два ответа о том, что такое векторная база данных, чтобы юрист понял. Кто лучше: Grok или GigaChat?»
Forwarded from All Things Legal
Американская Association for Computing Machinery провела интересный эксперимент - анализировали предпочтения простых граждан при выборе ответов на юридические вопросы от больших языковых моделей и от профессиональных юристов. При условии, что участник эксперимента не знали источник ответа - юрист или модель - большинство из них предпочитало действовать по советам БЯМ. В отдельном эксперименте проверили, могут ли люди различить ответ юриста от ответа модели. Оказывается, что могут. И все равно предпочитали действовать по рекомендациям ИИ. Эксперимент провели не для того, чтобы доказывать какое-то преимущество алгоритмов над людьми, а для того, чтобы оценить риски, связанные с ошибками моделей в высокорискованных случаях (к которым относятся юридические проблемы). Более подробно читайте в отчете «Objection Overruled! Lay People can Distinguish Large Language Models from Lawyers, but still Favour Advice from an LLM».

#ai
Forwarded from Spydell_finance (Paul Spydell)
Грандиозный рывок китайского ИИ

В условиях ограничений на вычислительные мощности, Китаю удается на равных конкурировать с флагманскими LLM в США и Европе.

После громкого релиза ChatGPT 3.5 в ноябре 2022 и значительного апгрейда на ChatGPT 4 в марте 2023, в следующие 1.5 года (!) до релиза o1-preview в сентябре 2024 не было прогресса в индустрии в условиях полного доминирования OpenAI.

Однако, конкуренты стали поджимать с середины 2024 (в особенности Anthropic c моделью Claude 3.5 Sonnet).

Китай начал позже (первая публичная версия появилась в июле 2023 - Qwen Chat 7B, но была чрезвычайно слаба), но темпы развития ошеломляющие.

Уже в декабре 2023 лучшая китайская LLM вышла по производительности на уровень ChatGPT 3.5 с Qwen1.5 Chat 72B, сократив отставание до одного года.

В сентябре 2023 вышла малоизвестная, но мощная модель GLM-4-Plus от Zhipu AI, которая по синтетическим тестам достигла ChatGPT 4 образца начала 2024 (отставание сократилось до 9 месяцев).

В октябре 2023 выходит Qwen2.5 Plus (первая китайская публичная модель, которая имела практическое применение), которой удалось сравняться с обновленным GPT-4o и Claude 3.5 Sonnet, но все еще значительно проигрывая по гибкости и функционалу.

С осени 2024 началась эпическая битва ИИ. Плотность релизов зашкаливающая.
Новым китайским лидером стала LLM - Step 2 от StepFun, а в декабре всем известный DeepSeek V3, который был лучшей нерассуждающей моделью в мире.

В декабре 2023 отставание Китая от американских флагманов был всего год, а в декабре 2024 Китай стал лидером, а спустя месяц появился DeepSeek R1, который и произвел медийный фурор, выводя китайские ИИ из отраслевого андеграунда в мейнстрим.

DeepSeek R1 не стал лидером, но приблизился к топовой на тот момент рассуждающей o1 от OpenAI, вот с февраля началась наиболее безумная ИИ гонка всех времен и народов, когда релизы новых LLM шли с периодичностью в 1-2 недели!

Несколько дней назад (28 мая) было произведено долгожданное обновление DeepSeek R1 без смены названия, но по тестам модель приблизилась к o3 и Gemini 2.5 Pro.


Китай начал позже, но в условиях дефицита ресурсов компенсировал технологический гэп и предлагает конкурентные решения.

Китай располагает целым зоопарком относительно конкурентных LLM (китайские модели подчеркнуты):

• o4-mini (high) и o3, OpenAI– 70 (интегральный уровень производительности по оценкам artificialanalysis.ai)
DeepSeek R1 (May 2025), DeepSeek – 68
• Gemini 2.5 Pro , Google – 68
• Grok 3 Mini Reasoning (high), xAI – 67
• Claude Opus 4 Thinking, Anthropic – 65
Qwen3 235B A22B (Reasoning), Alibaba– 62
SeedThinkingv1.5, ByteDance – 62
ERNIE X1, Baidu – 60
• Hunyuan T1, Tencent – 60

Kimi K1.5 Preview , MoonShot – 58
glm-z1- 32b, Zhipu – 56
step-r1- v-mini, StepFun – 55
MiMo-7B, Xiaomi – 54
Baichuan M1 (Preview), Baichuan - 52
• Llama 4 Maverick, Meta – 51
• Mistral Medium 3 – 49
• Nova Premier, Amazon - 43
MiniMax -Text-01, MiniMax – 40
• Phi 4, Microsoft - 40
YiLightning, 01 AI – 37

Для понимания скорости и масштаба прогресса. Распиаренный ChatGPT 4o, который был индустриальным стандартом в начале 2025 имел производительность около 40. Сейчас даже самая слабая китайская модель имеет производительность, как флагманский ChatGPT 4o в начале 2025 (до мартовского обновления), лучшая LLM от Google до декабря 2024 имела производительность всего 34 балла.

Сейчас в Китае 5 очень мощных игроков на рынке ИИ: Alibaba, ByteDance, Baidu, Huawei и Tencent и 5 передовых стартапов: DeepSeek, Zhipu, Stepfun, MiniMax и MoonShot AI.

В таблице представлена наглядная навигация по типам LLM от китайских разработчиков, в том числе для генерации изображений, видео и аудио.

Невероятный прогресс. Второе полугодие 2025 обещает быть интересным.
Forwarded from Киллер-фича
This media is not supported in your browser
VIEW IN TELEGRAM
Робот залетел на питерский юридический форум и поучаствовал в подписании документов. Железный бро успешно поднес к столу папки с бумагами.

Киберпанк приходит в Северную столицу России.

@killerfeat
Forwarded from Адвокатские войны (Сергей Наумов)
Люди - новая нефть.

Сегодня оказывается произошло очень интересное событие, которое имеет прямое отношение к информатизации адвокатуры. В третьем окончательном чтении сразу был принят вот этот законопроект.

С учётом того, что за ВК (символичный акроним Владимира Кириенко) закрепляется монополия на создание госмессенджера, со всеми последствиями, пытаюсь понять как быстро кураторы через ФПА обяжут адвокатов вести свои досье исключительно на российских госплатформах?

Я к тому, что вопрос защиты адвокатской тайны в современных условиях (чебурнетизации) по существу ФПА игнорирует.

КИС АР на откупе в дочке Сбера. Сбер проводит большую часть адвокатских транзакций (1). СберПраво и GigaLegal это потенциально корпоративный адвокатский стандарт с учётом продвигаемой монополии.

Но вот госмессенджер ВК из экосистемы Сбера конечно вырывается. Я предположу вариант олигополии на рынке общероссийской адвокатской цифровой платформы. Сбер и ВК как то договорятся между собой как поделить весь юридический рынок.

#адвокатская_эвристика @lawyersoft

Примечания и ссылки.
(1) Достоверных цифр о том, в каких банках больше всего счетов открыто у адвокатов у меня нет. Яндекс тоже не знает. Но исходя из факта, что значительная часть адвокатов работает по 51-й, а это бюджетные деньги в отношении которых действует правило УФК о предпочтении корр.счетов получателей в "госбанках", чаще всего в Сбере.
2025/06/11 10:17:46
Back to Top
HTML Embed Code: