Forwarded from Alan的小纸箱
Forwarded from Anyway.Now
Arial 的祸害
最近 JJ 去了一次澳门,参观了大赛车博物馆。看到不少岁数比自己还大很多的赛车,作为一个赛车游戏爱好者一开始还很兴奋,直到……在一部标着 70 年代的车上看到了 Arial 字体(诞生在八十年代),一下子兴致全无,于是想到了这篇同样也已经很老的文章
最近 JJ 去了一次澳门,参观了大赛车博物馆。看到不少岁数比自己还大很多的赛车,作为一个赛车游戏爱好者一开始还很兴奋,直到……在一部标着 70 年代的车上看到了 Arial 字体(诞生在八十年代),一下子兴致全无,于是想到了这篇同样也已经很老的文章
Forwarded from Garyの梦呓
DeepScaleR-1.5B-Preview
DeepscaleR-1.5b 是在 DeepSeekR1-distilled-Qwen1.5b 上仅使用 3800 A100h(~$4500) 进行 RL 微调的 LLM
该模型在 AIME 2024 上获得了 43.1%@1 的准确性,较基底(28.8%)提高 14%,在 1.5B 参数下超过了 o1-preview
(Arena Math 中 R1>Gemini 2 Thinking>o1p>Gemini 2 Pro)
Open sourced dataset, code, training logs and models
Github: Github.com/agentica-project/deepscaler
Inference GGUF
#AI
DeepscaleR-1.5b 是在 DeepSeekR1-distilled-Qwen1.5b 上仅使用 3800 A100h(~$4500) 进行 RL 微调的 LLM
该模型在 AIME 2024 上获得了 43.1%@1 的准确性,较基底(28.8%)提高 14%,在 1.5B 参数下超过了 o1-preview
(Arena Math 中 R1>Gemini 2 Thinking>o1p>Gemini 2 Pro)
Open sourced dataset, code, training logs and models
Github: Github.com/agentica-project/deepscaler
Inference GGUF
#AI
真的覺得世紀初摩爾定律太強大以至於大家寫程式的很自由奔放,不管是正夯的Java、蹭熱度的JavaScript還是Objective-C和Ruby都是自由得不行,什麼存取資料全過一下getter setter、method call是runtime傳個string、返回的是個opaque object你自己runtime去取class type,這種放到現在程式語言設計里都是會被當成anti-pattern的東西,在那個時候都像memory和cpu cycle不要錢一樣(x
#GeneralDev@Laoself
#GeneralDev@Laoself
Laoself 🙂↕️
真的覺得世紀初摩爾定律太強大以至於大家寫程式的很自由奔放,不管是正夯的Java、蹭熱度的JavaScript還是Objective-C和Ruby都是自由得不行,什麼存取資料全過一下getter setter、method call是runtime傳個string、返回的是個opaque object你自己runtime去取class type,這種放到現在程式語言設計里都是會被當成anti-pattern的東西,在那個時候都像memory和cpu cycle不要錢一樣(x #GeneralDev@Laoself
當然放到現在成分更複雜了,什麼天天吹自己的app是用rust寫的性能嘎嘎好又不memory leak也很safe,但是下回來一看是eletcron包rust on wasm。
https://nebula.tv/videos/jetlag-season-13-trailer
Wow, Jet Lag with Tom Scott in Schengen!
長期Badam & Tom Scott粉絲這下不知道該root for whom了(
Wow, Jet Lag with Tom Scott in Schengen!
長期Badam & Tom Scott粉絲這下不知道該root for whom了(
Nebula
Jet Lag: The Game — Jet Lag Season 13 — Official Trailer
Premieres March 5 at 10:30am ET | 3:30pm GMT.