✨مسابقه LLMs -شما نمی توانید همه آنها را راضی کنید!
🔹درست همانطور که انسانها را میتوان توسط دیدگاهها و تعصبات دستکاری کرد، LLM هایی که برای ارزیابیهای ذهنی استفاده میشوند دارای سوگیریهای مختلفی هستند که در برابر سوء استفادههایی که سیستم را هدایت میکنند آسیب پذیر هستند. یکی از راههای محدود کردن تأثیرات منفی این است که کمیتهای متشکل از LLMها با هم ارزیابی کنند.
💠این رقابت شما را به چالش میکشد تا بهرهبرداریها را برای سیستم LLM-as-a-judge که برای ارزیابی کیفیت مقالات طراحی شده است، شناسایی کنید. فهرستی از موضوعات مقاله به شما داده میشود و هدف شما ارسال مقالهای است که اختلاف نظر بین داوران LLM را به حداکثر میرساند. کار شما به شکل گیری درک بهتری از قابلیتها و محدودیتهای استفاده از LLM برای وظایف ارزیابی ذهنی در مقیاس کمک میکند.
🗓جدول زمانی
🟢تاریخ شروع: ۱۳ آذر ۱۴۰۳ 3 December 2024
🟢 آخرین مهلت ورود: ۷ اسفند ۱۴۰۳ 25 February 2025 برای شرکت در مسابقه باید قبل از این تاریخ قوانین مسابقه را بپذیرید.
🟢آخرین مهلت ادغام تیم:۷ اسفند ۱۴۰۳ 25 February 2025 این تاریخ آخرین روزی است که شرکتکنندگان میتوانند به تیمها بپیوندند یا ادغام شوند.
🟢مهلت ارسال نهایی: ۱۴ اسفند ۱۴۰۳ 4 March 2025
❗️تمام مهلتها در ساعت PM UTC 11:59 در روز مربوطه است، مگر اینکه غیر از این ذکر شده باشد. برگزارکنندگان مسابقه این حق را برای خود محفوظ می دارند که در صورت لزوم، جدول زمانی مسابقه را به روز کنند.
✨جوایز
🥇مقام اول - 12000 دلار 🥈مقام دوم - 10000 دلار 🥉مقام سوم - 10000 دلار 🎖مقام چهارم - 10000 دلار 🎖مقام پنجم - 8000 دلار
💬 پینوشت Large Language Model (LLMs) مدلهای بزرگ زبان، مدلهای یادگیری ماشینی هستند که میتوانند متن زبان انسان را درک کرده و تولید کنند. آنها با تجزیه و تحلیل مجموعه دادههای بزرگ زبان کار میکنند.
✨مسابقه LLMs -شما نمی توانید همه آنها را راضی کنید!
🔹درست همانطور که انسانها را میتوان توسط دیدگاهها و تعصبات دستکاری کرد، LLM هایی که برای ارزیابیهای ذهنی استفاده میشوند دارای سوگیریهای مختلفی هستند که در برابر سوء استفادههایی که سیستم را هدایت میکنند آسیب پذیر هستند. یکی از راههای محدود کردن تأثیرات منفی این است که کمیتهای متشکل از LLMها با هم ارزیابی کنند.
💠این رقابت شما را به چالش میکشد تا بهرهبرداریها را برای سیستم LLM-as-a-judge که برای ارزیابی کیفیت مقالات طراحی شده است، شناسایی کنید. فهرستی از موضوعات مقاله به شما داده میشود و هدف شما ارسال مقالهای است که اختلاف نظر بین داوران LLM را به حداکثر میرساند. کار شما به شکل گیری درک بهتری از قابلیتها و محدودیتهای استفاده از LLM برای وظایف ارزیابی ذهنی در مقیاس کمک میکند.
🗓جدول زمانی
🟢تاریخ شروع: ۱۳ آذر ۱۴۰۳ 3 December 2024
🟢 آخرین مهلت ورود: ۷ اسفند ۱۴۰۳ 25 February 2025 برای شرکت در مسابقه باید قبل از این تاریخ قوانین مسابقه را بپذیرید.
🟢آخرین مهلت ادغام تیم:۷ اسفند ۱۴۰۳ 25 February 2025 این تاریخ آخرین روزی است که شرکتکنندگان میتوانند به تیمها بپیوندند یا ادغام شوند.
🟢مهلت ارسال نهایی: ۱۴ اسفند ۱۴۰۳ 4 March 2025
❗️تمام مهلتها در ساعت PM UTC 11:59 در روز مربوطه است، مگر اینکه غیر از این ذکر شده باشد. برگزارکنندگان مسابقه این حق را برای خود محفوظ می دارند که در صورت لزوم، جدول زمانی مسابقه را به روز کنند.
✨جوایز
🥇مقام اول - 12000 دلار 🥈مقام دوم - 10000 دلار 🥉مقام سوم - 10000 دلار 🎖مقام چهارم - 10000 دلار 🎖مقام پنجم - 8000 دلار
💬 پینوشت Large Language Model (LLMs) مدلهای بزرگ زبان، مدلهای یادگیری ماشینی هستند که میتوانند متن زبان انسان را درک کرده و تولید کنند. آنها با تجزیه و تحلیل مجموعه دادههای بزرگ زبان کار میکنند.
"The inflation fire was already hot and now with war-driven inflation added to the mix, it will grow even hotter, setting off a scramble by the world’s central banks to pull back their stimulus earlier than expected," Chris Rupkey, chief economist at FWDBONDS, wrote in an email. "A spike in inflation rates has preceded economic recessions historically and this time prices have soared to levels that once again pose a threat to growth." There was another possible development: Reuters also reported that Ukraine said that Belarus could soon join the invasion of Ukraine. However, the AFP, citing a Pentagon official, said the U.S. hasn’t yet seen evidence that Belarusian troops are in Ukraine. Asked about its stance on disinformation, Telegram spokesperson Remi Vaughn told AFP: "As noted by our CEO, the sheer volume of information being shared on channels makes it extremely difficult to verify, so it's important that users double-check what they read." Given the pro-privacy stance of the platform, it’s taken as a given that it’ll be used for a number of reasons, not all of them good. And Telegram has been attached to a fair few scandals related to terrorism, sexual exploitation and crime. Back in 2015, Vox described Telegram as “ISIS’ app of choice,” saying that the platform’s real use is the ability to use channels to distribute material to large groups at once. Telegram has acted to remove public channels affiliated with terrorism, but Pavel Durov reiterated that he had no business snooping on private conversations. Despite Telegram's origins, its approach to users' security has privacy advocates worried.
from sg