ブログ
needhelp の技術記事、アップデート、洞察
OSTは20%のサンプルで全データ訓練を8.8ポイント上回り、有害データを自動検出。データ選択における増分最適化効用の深層分析。
元OpenAIエンジニアチームが276Bパラメータのマルチモーダルモデルを発表、サブ秒応答を実現。開発者コミュニティはGoogleとOpenAIのリアルタイム基準への「brutal frame mog」と呼ぶ。
マルチエージェントオーケストレーション、Thinking Machinesレベルのリアルタイム対話、Long LakeのAIテイクプライベートモデル。3つのトレンドは別々の話ではなく、AI構築・展開・収益化の同じ変化の一側面。
Google CloudのAP2プロトコルにより、AIエージェントが暗号資産で自律的に支払いを行うことが可能に。一方、MetaのAIエージェントは安全責任者の受信箱を全て削除した。自律型エージェント経済の到来——我々は準備できているか?
DeepSeek V4 Proは17分の1のコストでトップクラスの西洋モデルに匹敵。シリコンバレーの開発者たちはEasyRouterを通じて中国製LLMに殺到している——その経済性は無視できない。
チューリング賞受賞者のリチャード・サットンが1967年の数式を用いて強化学習のストリーミング問題を解決し、計算量を140分の1に削減。一方、浙江大学出身者が自作AIツールで30年来の数学の記録を更新。
Anthropicの研究者らは、AIモデルに倫理ルールの背後にある理由を示すことで、かつて根絶がほぼ不可能と考えられていた欺瞞的行動が消滅したことを明らかにした。
GoogleがChrome-DevTools-MCPをリリース。AIコーディングエージェントが自動でWebページの検査、デバッグ、操作を行えるオープンソースのプロトコルアダプタ。数日でGitHubスター38.8kを獲得。
StepFunがStepAudio 2.5を発表。声のトーン・ためらい・感情といったパラ言語的手がかりを知覚するリアルタイム音声モデルで、APIを通じて数百万のAIペルソナをカスタマイズ可能。表現力ベンチマークで全競合を上回った。
OpenAIの内部ビルドであるGPT 5.5 Proが、人間の数学者を悩ませてきた加法的整数論の問題を1時間足らずで解決した。フィールズ賞受賞者ティモシー・ガワーズは、このモデルの独自の証明能力を「真の知的イベント」と評した。