AI News Digest: 2026-05-24
Top 20
Antigravity 2.0 CLI 使ってみた
Source: Zenn | Published: 2026-05-24 11:58 JST
- 同一Unityプロジェクトの分析タスクで、Antigravity 2.0 CLI(Gemini 3.5 Flash)は3分1秒、Claude Codeは4分8秒となり、速度面でAntigravityが優位だったと報告している。
- 一方で
GameLoopType.csの8個のenum値のうち3個を読み落とすなど、ファイル読み込みの網羅性に推論で補う傾向が見られたとしている。 - 6つの評価軸(事実と推論の分離、初期ユーザーへの説明性、ファイル網羅性など)で観察した結果、Geminiは入門者向けの解説品質が「かなり良い」と評価される一方、実装の安全性ではClaude Sonnet 3.7の方が上だったと述べている。
- スキル定義とMarkdownベースのタスク管理を併用してエージェントの推論越権を抑える運用が現実解であると結論づけている。
- 著者は両者を競合ではなく補完関係と位置付け、Unityワークフローでは目的に応じて使い分けることを勧めている。
【トピックス確認】Gemini Omni Flash 発表 ― 動画生成と会話型動画編集で何が変わりそうか
Source: Qiita | Published: 2026-05-24 22:23 JST
- Google I/O 2026でGemini Omni FlashがGemini Omniモデル群の一員として発表され、テキスト・画像・動画・音声を入力に取って会話を通じた段階的な動画編集ができる点が新しいと整理している。
- 「すべての指示が一つ前の指示の上に積み上がる」フローを採用し、キャラクター一貫性の維持や物理法則の遵守を行いながら背景・視点・スタイルを順次調整できると説明している。
- Avatars機能では自分の声と見た目に似たアバター動画を生成でき、商品説明や教育コンテンツ制作での活用が現実的になったと位置付けている。
- 単発の高品質動画生成からの差分として、推論能力と世界知識を組み合わせ「次に何が起こるか」を推論する方向にモデルが進化していると指摘している。
- 既存素材の再編集ワークフローと組み合わせることで、撮り直し不要のマーケティング素材改修や教材アップデートが現実的なユースケースとして提示されている。
OpenAI、80年未解決の数学問題を解いたと発表――今度こそ本物か
Source: Zenn | Published: 2026-05-24 10:01 JST
- OpenAIが1946年にエルデシュが提起した「単位距離問題」をGPT-5で解いたと発表し、長年支持されてきた正方格子配置が最適という予想を覆す新しい配置を見つけたとしている。
- 専用の幾何ツールではなく汎用の推論モデルが導いた結果である点、および前回の数学発表時に誤りを指摘したフィールズ賞受賞者ティム・ガワーズらが今回は成果を支持している点を、信頼性の根拠として挙げている。
- 著者は「AIが解いた」発表をそのまま受け入れず、第三者の数学者による厳密な検証と専門家の支持を確認するプロセスが今後も不可欠であると釘を刺している。
- 結果が正しければAIが既存予想を破る新しい数学的発見を生んだ最初期の実例となり、AI数学研究の重要なマイルストーンになり得ると評価している。
- 同時に、汎用モデルが組合せ幾何のような専門分野で踏み込んだ寄与をする時代に入ったことで、研究者がAIをどう検証フローに組み込むかが新たな課題になると述べている。
Claude Code の Routines と Channels — スケジュール実行の仕組みを公開情報から整理
Source: Qiita | Published: 2026-05-24 23:56 JST
- Anthropicが公開したRoutines(4月14日発表)とChannels(3月20日発表)の仕様を、公開情報から再整理し、Claude Codeがエディタ内アシスタントからバックグラウンドエージェント基盤へと拡張されたと位置付けている。
- Routinesは時間ベース(Hourly/Daily/Weekdays/Weekly/任意cron)に加え、GitHubイベント(pull_request、push、issues、check_run、workflow_run、discussion、release、merge_queue)でも起動できる。
- 日次実行回数の上限はPro 5回、Max 15回、Team/Enterprise 25回と明示されており、利用プランに応じてバックグラウンド処理量が制限されていると説明している。
- Channelsはallowlist方式で事前承認した送信者IDからのメッセージのみを受け付け、Telegram・Discord・iMessage(macOS)・カスタムWebhookに対応している。
- 著者は「自宅PCが稼働していなくても動く運用」をRoutinesに、「人間がチャットでトリガーする運用」をChannelsに担わせる住み分けが現時点での実用パターンだと整理している。
「Gemini」「Claude Code」「Codex」 全社展開・本番実装に役立つ5つのポイント
Source: ITmedia AI+ | Published: 2026-05-24 08:00 JST
- Google、Anthropic、OpenAI Japanの3社が共同で語る、Gemini/Claude Code/Codexを「コード補完」止まりにせず全社展開・本番実装まで進めるための5つの実践ポイントを整理した解説記事である。
- Geminiについては「RSFC」フレームワークと構造化プロンプトを使うことで回答精度が大きく改善するとし、組織として共通のプロンプト構造を定義する重要性を指摘している。
- Claude Codeでは
.claudeフォルダ構造とCLAUDE.md/AGENTS.md/DESIGN.mdといったコンテキストファイル群が、プロジェクト全体を理解するエージェント化の鍵だと示している。 - CodexはSlackなど業務システム統合により、コードベース全体のワークフローへ展開でき、Model Context Protocol(MCP)やAgent2Agent Protocol(A2A)と組み合わせて段階的に本番投入することを推奨している。
- 最終的にはAIによるドキュメント自動更新を担う「LLM Wiki」の整備が、組織知の継続的な最新化を支えるとして、まず既存設定ファイルの作成から着手することを勧めている。
Deepmind’s Hassabis sees humanity “in the foothills of the singularity” while LeCun says current AI isn’t intelligent(DeepMindハサビス氏は人類が「シンギュラリティの裾野」にいるとし、ルカン氏は現在のAIは知性ではないと主張)
Source: The Decoder | Published: 2026-05-24 21:54 JST
- DeepMindのデミス・ハサビスが「人類はシンギュラリティの裾野に立っている」と述べ、AGIは5年以内に到達可能で「産業革命の10倍の規模を10倍の速度で起こす」と発言したと報じている。
- 一方Meta傘下のヤン・ルカンは「知性とは知っていることではなく、知らないときに何をするかだ」と語り、現在のLLMは経験から学んで真に新規な問題を解いていないため知性ではないと反論している。
- DeepMindのオリオール・ヴィニャルスは中道の立場をとり、現在のモデルはコードと数学で優れ汎化推論も向上しているが「経験から学び本当のブレークスルーを生む能力はまだ欠けている」と指摘した。
- 三者の発言を並べることで、業界トップ研究者間でも「現在のAIは知性なのか/シンギュラリティはどこまで近いのか」という根本評価が大きく割れている現状を浮き彫りにしている。
- 経営層に向けたメッセージとしては、楽観論と懐疑論のどちらか一方に賭けるのではなく「経験から学ぶ仕組み」が次の節目を握るというヴィニャルスの整理が実務上は最も参考になると示唆している。
Why you shouldn’t leave model selection on default in Copilot, Gemini and other AI tools(Copilot・Gemini等のAIツールでモデル選択をデフォルトのままにすべきでない理由)
Source: The Decoder | Published: 2026-05-24 19:17 JST
- 数学者アダム・クチャルスキの実験で、Copilotが「全く同じ200件の発言」を米英仏独伊の5カ国分に複製したデータに対し「イタリア人は英国人の3倍アートに関心がある」と捏造したと報じている。
- データが同じだと指摘し直しても、Copilotは「キーワード数は一致する」と認めつつ、別の捏造割合を伴う差異分析を提示し直したという。
- ChatGPT Instant、Claude Opus 4.7など推論モードに自動で切り替わる新世代モデルはPythonで集計を行い、5データセットが重複である事実を正しく検出したと整理している。
- CopilotやGeminiでも手動で推論モードへ切り替えれば重複を検出できたため、問題は「ユーザーが既定モデルのまま使うこと」にあるとクチャルスキは結論づけている。
- 推奨される実務対策として、依頼前に期待結果を書き出し、AI出力を信用する前にシンプルなサニティチェックを必ず行うことが提示されている。
Antigravity刷新でコードエディター選びはどう変わる?4つの入口で整理する
Source: Zenn | Published: 2026-05-24 20:26 JST
- Google I/O 2026で打ち出されたAntigravityが、単一のAI搭載コードエディタから「エージェント開発プラットフォームの総称」へと再定義された経緯を整理している。
- 4つの入口として、Antigravity 2.0(デスクトップ管理)、Antigravity IDE(人間が書く場)、Antigravity CLI(コマンド
agyで呼ぶ場)、Antigravity SDK(エージェント組み込み用ライブラリ)の役割分担を表で示している。 - 「2.0はAIに仕事を振る場所、IDEは人間が書く場所、CLIはターミナルから振る場所」という著者の表現を引用し、利用者像(非開発者、個人開発者、CLIエンジニア、プラットフォームチーム)ごとの選び方を提示している。
- 4つは排他ではなく重ねて使うことを前提に設計されているため、組織は「どれを採るか」より「どこから入るか」を決めるべきだと結論づけている。
- 結果として、コードエディタ選定の議論はIDE単体比較から「エージェントプラットフォーム全体の入り口設計」へと移ったと位置付けている。
AppleがWWDCに先立ち「Gen AI」(生成AI)用のサブドメインを準備していることが明らかに
Source: GIGAZINE | Published: 2026-05-24 19:00 JST
- Appleが生成AI用サブドメイン
genai.apple.comを登録していることが判明し、6月8日からのWWDC 2026での発表に備えている可能性が高いと報じている。 - 該当ページは現時点ではアクセスできず、用途は未公開だが、既存のApple Intelligence専用ページとは別系統として確保されている点が注目される。
- WWDC 2026ではiOS 27/iPadOS 27/macOS 27と並行して、「複数アプリをまたいでタスクを処理するAIエージェント」として大幅刷新されたSiriが発表される見込みであると伝えている。
- プライバシー重視機能の一例として、チャット履歴の自動削除など、Apple Intelligence強化のアクセシビリティ拡張も予告されていると整理している。
- 専門メディアは「genai.apple.com」がApple独自の生成AIサービスを束ねる入口になる可能性を指摘しており、ChatGPT統合を超える独自路線への一歩と位置付けられている。
ByteDance study finds that asking LMMs questions beats making it transcribe text for long document training(ByteDance研究、長文ドキュメント学習はLMMに転写させるよりQ&Aさせる方が有効)
Source: The Decoder | Published: 2026-05-24 22:28 JST
- ByteDance SeedがQwen2.5-VL-7Bをベースに構築した70億パラメータのマルチモーダルモデル「MMProLong」を発表し、画像中心の長文ドキュメントで高い理解性能を示したと報じている。
- 学習時のコンテキスト長は128,000トークンだが、256,000および512,000トークンでも安定動作し、学習長の4倍まで外挿できることを実証している。
- MM-NIAH(マルチモーダル版Needle-in-a-Haystack)ベンチマークで、ベースモデル比平均29.4ポイントの性能向上を達成したと報告している。
- 学習タスクとしては「Q&A合成」が有効である一方、「純粋なテキスト転写タスク」はかえって性能を低下させたとし、長文理解には文字認識ではなく必要情報を取り出す訓練が効くと結論づけている。
- 評価にはMMLongBench(64K/128K)に加えVideo-MMEやMLVUなどの長尺動画ベンチも使われ、長文書から長動画への転移性能も併せて検証されている。
Claude Opus 4.7とGPT-5.5 Instantを併用する「三層レビュー」ワークフローを装してみた
Source: Zenn | Published: 2026-05-24 08:28 JST
- 2026年5月にClaude Opus 4.7とGPT-5.5 Instantが相次いで公開された状況を踏まえ、複数モデルを役割分担させる「三層レビュー」ワークフローを実装したと報告している。
- 初稿生成はGPT-5.5 Instant、論理レビューと修正はClaude Opus 4.7、3行要約はGemini 3.5 Flashという3モデル分担構成を採用している。
- 役割を分けることで単一モデル運用時より出力品質が安定し、受託業務のドラフト納品まで含めれば「2〜3倍のターンアラウンド短縮」が見込めると著者は試算している。
- 同一モデルに全工程をやらせると初稿の癖がレビューにも持ち越されやすいため、別系統モデルでクロスレビューさせる点が品質向上の要だと整理している。
- 新モデル世代の続々登場を「単独最強モデルを探す」競争ではなく「組み合わせ最適化」の素材として捉え直す視点を示している。
【Fedora Linux × IntelliJ】新世代AIエージェント Antigravity 導入・連携ガイド
Source: Zenn | Published: 2026-05-24 20:33 JST
- Antigravity CLI(
agy)をFedora LinuxとIntelliJで実用するための具体的なセットアップ手順をまとめた導入ガイドである。 - CLI導入は
curl -fsSL https://antigravity.google/cli/install.sh | bashを実行し、~/.zshrcにexport PATH="$HOME/.local/bin:$PATH"を追記してリロードする流れを示している。 - IntelliJとはSettings → Tools → Antigravity Companionで実行パスを設定し「Start Antigravity Session」を押すだけで連携でき、MCP経由でIDEとAI成果物のコンテキスト共有が自動化されると報告している。
- IntelliJの通知で「An important update: Transitioning Gemini CLI to Antigravity CLI」が表示され、既存のGemini CLIユーザーがAntigravity CLIへ自然に移行させられる構造になっていると整理している。
- チャットUIとエディタ間のコピペ往復が消えることで、ローカルLinux環境でも新世代エージェントを実務ワークフローに組み込めるようになると評価している。
MicrosoftとEU研究機関が示すAIガバナンスの国際基準案、AI Act(AI法)施行に備えてる日本企業SIer像は
Source: Zenn | Published: 2026-05-24 22:41 JST
- 2026年5月20日にMicrosoftがFraunhofer、ETH Zurich、欧州AIオフィスと共同で「企業が生成AIを安全に運用するための実装可能なガバナンス基準」を発表したことを起点に解説している。
- 基準は透明性、説明可能性、データ境界管理、定期評価、安全性とレジリエンス、監査ログという6つの運用柱で構成されており、原則論ではなく実装フェーズへ踏み込んだのが特徴だと整理している。
- 「AIの安全はベンダーと導入企業の双方の責任」という前提が明示されたことで、EU AI Act施行に向け日本のSIerにも「AIシステム全体の設計者」としての役割転換が迫られていると指摘している。
- 日本のSIerは単なるAI導入支援から、ガバナンス設計を含むコンサルティングとプロンプト攻撃対策、規制業種向けの要件定義までを担う方向へ業務領域を拡張する必要があると論じている。
- 若手エンジニアに対しては、リスクアセスメント、プロンプト攻撃防御、規制業種向け要件定義を新たな専門領域として育てておくよう促している。
苦手なPythonだけどGemini CLIと強力タッグ!血糖測定器「FreeStyle Precision Neo」のデータ可視化デスクトップアプリを開発し、GitHub Actionsでインストーラー自動ビルドまで実現した話
Source: Qiita | Published: 2026-05-24 09:37 JST
- Abbott社の血糖測定器「FreeStyle Precision Neo」のデータをMicro-USB経由で取得し、PCローカルで可視化するデスクトップアプリ「tw-precision-neo」を、Gemini CLIをペアプログラマとして開発した記録である。
- 機能として時系列グラフ、ヒートマップ、TIR(Time In Range)自動計算、mg/dLとmmol/Lの両単位対応を備え、データはすべてSQLiteにローカル保存しクラウドに送信しないプライバシー設計を採用している。
- フロントエンドはECharts.js/DataTables.jsで構築し、バックエンドはPython+pywebview+glucometerutilsを組み合わせる構成を、Gemini CLIがアーキ設計とSQLiteスキーマ設計まで支援したという。
- 配布はmacOS向けに
miseタスクでローカル署名・公証して.pkgを生成し、Windows向けはGitHub Actions(windows-latest)でPyInstallerにより.msiと.zipを自動ビルドする構成を採っている。 - 著者は「AIをペアプログラマーとして頼ることで、使い慣れていない言語でも本職並みの速度で完成させられた」と述べ、個人開発における言語の壁が大きく下がっていると結論している。
Claude.ai コネクタ5選——280件から厳選、Claude Code利用者が最初に設定すべきツール
Source: Qiita | Published: 2026-05-24 21:55 JST
- 公式Claude.aiコネクタが約280件に達した2026年5月時点で、Claude Codeユーザーが最初に設定すべき5つを著者の実利用観点で厳選している。
- 選ばれたのはGmail(10ツール)、Google Calendar(8ツール)、Google Drive(8ツール)、Slack(13ツール)、Exa(2ツール)の5つで、合計41ツールが日常作業を覆うと整理している。
- Gmailはメール閲覧と下書き作成をClaude内で完結させ、Google Calendarは他者との時間調整・空き時間確認に役立つと用途を具体化している。
- Google DriveはモバイルとCLI間でファイルを橋渡しする中間ストレージ、Slackは
slack_send_messageを使った自動タスクの完了通知用と、機能ではなく運用上の役割で評価している。 - ExaはClaudeの学習データカットオフを補う最新Web情報源として位置付けられ、5つ揃えれば「全部使う必要はないが日常運用に必要な土台が揃う」と結論づけている。
AWS MCP Server でAIエージェントと人間の IAM 権限を分離してみた
Source: Zenn | Published: 2026-05-24 17:00 JST
- AWS MCP Serverに新設された
aws:ViaAWSMCPServiceとaws:CalledViaAWSMCPというIAMコンテキストキーを使い、同じIAMユーザーでもAIエージェントと人間の権限を分離する実装を試したレポートである。 - これらのコンテキストキー付き条件でDenyポリシーを書くことで、AIエージェントには参照系のみ許可し、削除や課金影響のある操作は人間が直接実行する場合だけ認める構成を実現している。
- 実装手順としてはCloudShellからAWS MCP Serverを動かしClaudeから操作させる流れを示し、ポリシー検証時の通り方/弾かれ方を実コマンドで例示している。
- AIエージェントに広い
AdministratorAccessを渡しがちな現状に対し、「同じユーザーで権限を文脈ごとに切り替える」という安全策が公式機能として整備された意義を強調している。 - 著者は今後、エージェント運用ではこのコンテキストキーを前提にしたガードレールIAMポリシーがベースラインになると示唆している。
AI同士のhandoffを多層契約チェックリストにした
Source: Zenn | Published: 2026-05-24 22:03 JST
- CodexとClaude Codeを跨いだAI同士のhandoffで起きやすい「触ってはいけないファイルまで改変」「
published: trueやgit pushを勝手に実行」といった事故を、6層の契約チェックリストで防ぐ手法を提案している。 - 6層は目的契約(やらないことの明示)、範囲契約(編集可/保護対象ファイルの定義)、権限契約(編集とコミット/公開の分離)、完成契約(正常/前提/エラー/非劣化)、検証契約(自動コマンドとレビュー観点の組)、失敗契約(停止条件の明示)で構成される。
- 各契約は機械的に検証可能なフォーマットで書き、簡単なスクリプトで「必須セクションの欠落」を検出するだけでも範囲逸脱を大きく減らせると説明している。
- 著者は単発のhandoff指示ではなく「強制力のある契約」として記述することで、エージェント間の責任分界とレビュー観点を一貫させられると整理している。
- 結果として、人間レビューに頼らずともAIエージェント同士で安全に作業を引き継げる運用パターンに近づくと結論している。
LLM ナレッジグラフ運用 2026 (連載第1部): Karpathy の三層アーキテクチャを 1 ヶ月運用して見えたこと
Source: Zenn | Published: 2026-05-24 23:09 JST
- Andrej Karpathyが提案した「LLM Wiki」の三層アーキテクチャ(Raw/Wiki/Schema)を1ヶ月運用した結果、LLMのハルシネーション率が体感1/10以下まで下がったと報告している。
- Raw/Wiki/Schemaの三層を毎回プロンプトに添えることで、LLMは「記憶する側」ではなく「読む側」に回り、構造的にハルシネーションが抑えられたと分析している。
- 運用実態は受信箱に80件以上の一次ソース、curate済みトピック12件、週次レビューを5段階のClaude Skillsで自動化、1トピック当たり30分〜1時間で蒸留しているとコスト感を具体的に示している。
- 著者は2026年のLLM活用の本質が「要約」から「横断統合」へ移ったとし、個別モデル性能より「何を渡し、知識をどう繋ぐか」が勝負どころだと結論づけている。
- Schema層をYAMLフロントマターで軽量グラフとして表現するなど、専用DBに頼らずGit管理で運用できる現実的な設計が紹介されている。
AIエージェント設計の5つの型は、どう噛み合うのか ── 競合しない「補完スタック」という見方
Source: Zenn | Published: 2026-05-24 20:30 JST
- AIエージェント設計のトレンドであるSDD(仕様駆動)、Harness Engineering、EDD(評価駆動)、12-Factor Agents、OWASP/NIST の5つの型を、競合ではなく補完的に重ねるスタックとして整理し直している。
- SDDは「何を作るか」、Harnessは「どう安全に走らせるか」、EDDは「正しさをどう測るか」、12-Factor Agentsは横断的な設計規律、OWASP/NISTはセキュリティとガバナンスの外枠、という役割分担を提示している。
- 著者は車のアナロジーを用い、AIモデルはエンジンに過ぎず、車体・タイヤ・ダッシュボード・安全装備すべてが揃って初めて実用走行できると説明している。
- 議論の問い方を「どの型を採用するか」から「いまどの層が欠けているか」に切り替えるべきだと提案し、不足層から順に導入する実装順序の重要性を強調している。
- どのAIモデルを使うかに関わらず実装順序の重要性は普遍であるとし、モデル選定中心の議論から設計層の補完中心の議論へと移行を促している。
Claude Code Routines:Anthropic インフラで動くスケジュール自動化を整理
Source: Qiita | Published: 2026-05-24 23:49 JST
- Claude Code Routinesを「Anthropic管理インフラ上で実行されるスケジュール自動化機能」として独立に解説し、ローカルマシンの常時起動も自前サーバーも不要である点を強調している。
- トリガーはスケジュール、API、GitHubイベントの3種類で、ローカルPCがオフラインでもAnthropicのクラウドで処理が継続される点が、Channelsとの最大の差分だと整理している。
- ProとMaxプランの利用者は3回まで無料で試行できるため、まずは破壊的でない補助タスク(依頼レビュー、定例レポート、ステータス整理など)から導入する低リスク運用を勧めている。
- 同じ著者によるRoutines/Channels横断記事と本記事の役割分担として、本記事はRoutines単体の運用観点(実行基盤、無料枠、適性タスク)に絞っている。
- 著者は「無料枠で動くスケジュール実行は、自前のクラウドFunctions運用と比べて運用負担が大きく下がる」と評価し、定例業務の自動化候補として最初に検討すべき選択肢だと位置付けている。
All Articles
Zenn
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | 自作MCPサーバーを書いて公開するまで ― Claude × GPT 相互レビューを題材に | Pythonのmcpパッケージで自作MCPサーバーを書き、pyproject.tomlでパッケージ化してPyPIに公開し、Claude Code/Desktopからuvx一発で呼び出せるまでの流れを実装事例で解説している。 | @miharu_tools | 22:26 |
| 2 | 育休パパがCoworkで育児×家事×食事を最適化した1ヶ月🍼 | 育休中の親がCowork系ツールと独自開発の「start-daily」スキルを使い、朝のチャットだけで育児ログ集計・献立決定・スケジュール管理を1ヶ月自動化した運用記録を共有している。 | @enjoy_nori | 22:20 |
| 3 | AI同士のhandoffを多層契約チェックリストにした | CodexとClaude Code間のhandoff事故を防ぐため、目的/範囲/権限/完成/検証/失敗の6層契約として記述しスクリプト検証可能にする手法を提案している。 | @harness | 22:03 |
| 4 | OpenAI、80年未解決の数学問題を解いたと発表――今度こそ本物か | OpenAIが汎用推論モデルGPT-5でエルデシュの「単位距離問題」を解き、過去誤りを指摘したフィールズ賞受賞者ガワーズらも今回は支持していると整理している。 | @quotidia | 10:01 |
| 5 | MicrosoftとEU研究機関が示すAIガバナンスの国際基準案、AI Act(AI法)施行に備えてる日本企業SIer像は | Microsoftと欧州研究機関が共同で6本柱の生成AIガバナンス基準を発表したことを起点に、日本のSIerが「AIシステム全体の設計者」へ役割転換すべきだと論じている。 | @syoshida07 | 22:41 |
| 6 | 源内 Webに接続する生成AIアプリ(メトリクスチェッカー)を作ってみた | デジタル庁OSSの源内WebにBedrockベースのメトリクスチェッカーを接続し、APIキーとクロスアカウントRoleでCloudWatch指標を安全に取得する実装を解説している。 | @jnxjez | 22:36 |
| 7 | Google DeepMindのFabulaを参考に、小説執筆サービスへ「作品を理解するAI」を組み込んだ話 | 小説執筆SaaSに、保存後の非同期処理で生成した「AI用読書メモ」を組み込み、過去設定や未回収伏線を踏まえた執筆支援を実現したと報告している。 | @joh_luck | 22:26 |
| 8 | 今日のAI勉強会でやったこと:Antigravity CLI と Twitter API v2 | AI勉強会でAntigravity CLI(agy)のインストール・操作とtweepyによるX自動投稿実装を扱い、Read/Write権限再生成や課金エラー対応の実例を共有している。 | @udm | 21:13 |
| 9 | OCP ORV3が変えるデータセンター電源アーキテクチャ - 分散BBU化とTCO構造の再設計 | OCP ORV3の48V分散BBUがGPUワークロード由来のms単位30〜100%変動を局所吸収することで、中央UPSを瞬時変動吸収役へ転換しデータセンター全体のTCO構造を変えると論じている。 | @ext_ta1 | 20:39 |
| 10 | 週刊AI駆動開発 - 2026年05月24日 | Google I/O 2026のGemini 3.5 Flashを起点に「エージェント駆動開発の土台強化」をテーマとし、小型モデル実用化と推論コスト削減ツール、オープンウェイトモデルの動向を1週間分まとめている。 | @pppp303 | 20:26 |
| 11 | 「そのツール、ありません」とAIが言う本当の理由は、DDNSだった | Claudeから「ツールが見つからない」と返される断続的な不具合の原因がDDNS解決の不安定さにあったと特定し、Cloudflare Tunnelへの移行で恒常的に解消したと報告している。 | @kitepon | 20:18 |
| 12 | 【Unity】敵AIのターゲットを動的に切り替える方法 | Unityで敵AIのターゲットを状況に応じて切り替える際、デフォルトターゲットを保持しておくことで一時的な目標変更と復帰処理をシンプルに実装できる設計を示している。 | @sumcol03 | 20:00 |
| 13 | 【Claude Code】Agent Skill作成時の雑なTips 3選 | 公式Skill authoring best practicesをAIにレビューさせる、progressive disclosureとフィードバックループを優先採用する、修正のたびに軽量検証する、という3つを習慣化することを勧めている。 | @dk96424 | 19:40 |
| 14 | 仕様駆動開発最前線 — SDLC を一周描き直す Living Book | AIコーディングエージェントを生産性の核に据えるためにSDLC一周分を再設計するLiving Bookとして、仕様策定からリリース管理、ログ設計までの実践知見を継続改訂で公開している。 | @myntai | 19:06 |
| 15 | AIエージェントの記憶を要約で壊さない:TiDB Cloudで作るBreadcrumb Memory | 要約で値を再生成するのではなく原文へのパンくず参照を残し、必要時にフル文脈を取りに行く「Breadcrumb Memory」を、SQLとベクトル検索を1クエリで扱えるTiDB Cloudで実装する設計を解説している。 | @monruho | 18:43 |
| 16 | AI Skill手書きガイド:Claude Codeで再利用可能な能力モジュール | Claude CodeのSkillを抽象論ではなく具体的かつ機械実行可能な手順として手書きすることで、/skill-name一発で再利用できる「習慣」をAIに与える書き方を解説している。 | @lumichy | 18:41 |
| 17 | prompt / context / harness: ボトルネック移動で読むLLM engineeringの系譜とその先 | LLM engineeringのボトルネックがprompt→context→agent→harnessと外側へ移ってきた系譜を整理し、次の主戦場はeval設計とA2Aガバナンスになると主張している。 | @biscuit | 18:21 |
| 18 | コードグラフ × AIエージェントで「リファクタリング自動化」を組む実装パターン | 依存関係を表すコードグラフをAIエージェントに渡すことで、半自動リファクタリングの精度と速度を両立しつつ、最終変更と検証は人間が握る運用パターンを示している。 | @kenimo49 | 18:09 |
| 19 | 複数プロジェクトのテンプレを束ねる kata | 「型」をテンプレートとして複数プロジェクトに押し当て、共通ボイラープレートを一元管理しつつ上流の変更を全プロジェクトに自動伝播させるツール「kata」を紹介している。 | @yukimemi | 18:01 |
| 20 | LLMワークフローにおける決定論という罠 | 非決定論的なLLMワークフローを厳格に決定論化しても品質は必ずしも上がらず保守負担だけが増えるため、まずはMarkdown中心の緩い接続で始め失敗が見えてから厳格化すべきだと提言している。 | @shuymn | 17:55 |
| 21 | DevEx は快適さではなく、判断摩擦の設計である - 構造で育てるプロダクト組織シリーズ付録5 | DevEx改善の本質は開発者を快適にすることではなく、組織側が未設計の判断摩擦を構造から取り除き、開発者が本来の設計判断に集中できる状態を作ることだと再定義している。 | @kanaria007 | 17:55 |
| 22 | AWS MCP Server でAIエージェントと人間の IAM 権限を分離してみた | AWS MCP Serverの新IAMコンテキストキーaws:ViaAWSMCPService/aws:CalledViaAWSMCPを使い、同一IAMユーザー上でAIエージェントと人間の権限を分けるDenyポリシー構成を試している。 | @acntechjp | 17:00 |
| 23 | AIはユーザーテストの代わりになれるか? AIペルソナに開発中の画面を触らせてみた | AIペルソナはユーザーテストを置き換える存在ではなく「別レイヤーとして成立する」ものであり、開発中の画面に対する高速で頻繁なUXフィードバック層として機能すると結論づけている。 | @balista | 16:58 |
| 24 | 【Fedora Linux × IntelliJ】新世代AIエージェント Antigravity 導入・連携ガイド | Fedora LinuxでAntigravity CLI(agy)をインストールし、IntelliJのSettings → Tools → Antigravity Companion経由で接続するまでの具体的セットアップ手順を解説している。 | @dewins | 20:33 |
| 25 | AIエージェント設計の5つの型は、どう噛み合うのか ── 競合しない「補完スタック」という見方 | SDD、Harness Engineering、EDD、12-Factor Agents、OWASP/NISTという5つのAIエージェント設計型を、競合関係ではなく上下に重ねる補完スタックとして整理し直している。 | @ukiajp | 20:30 |
| 26 | GitHubCopilot(CLI)でOpenCode Goを使う | OpenCode Goを「持続可能なサブスクLLM」として位置付け、高額プラン契約に踏み切れない層に有効である一方、リクエスト消費量の多さから高性能モデル利用には工夫が必要だと評価している。 | @arika | 19:29 |
| 27 | AIエージェントが毎回データを取りに行く設計の限界 | AIエージェントを毎クエリで複数システムから情報取得する「scatter-gather」ではなく、知識グラフで事前統合する「Memory-first」設計へ移行することで、レイテンシ・トークン消費・推論誤りを同時に減らせると主張している。 | @knowledge_graph | 17:44 |
| 28 | Cognitive Runtime Architecture: Context Pointer OS (CPOS) の設計 | AIを「認知プロセス」として統治するCognitive Runtime Architecture「Context Pointer OS(CPOS)」を提唱し、長期稼働エージェントに信頼性・安全性・制御可能性を与える基盤として位置付けている。 | @emilia_lab | 17:32 |
| 29 | Amazon S3 Vectorsでacl.jsonではなくmetadata filterを選んだ制限付きRAG試してみた | Amazon S3 Vectors+Bedrock Knowledge BasesでCognitoグループに基づくmetadata filterを使い、Knowledge Basesを分けずに単一Lambdaでドメイン別アクセス制御RAGを実現したと報告している。 | @fusic | 16:54 |
| 30 | Decoder-only Transformerとは?GPT系LLMの構造を整理 | GPT系LLMのDecoder-only Transformerは過去トークンだけを見て次トークンを予測する自己回帰型構造であり、Web大規模次トークン予測だけで多タスク能力を獲得できることを「Language Models are Unsupervised Multitask Learners」をもとに整理している。 | @kas_blog | 15:59 |
| 31 | 【新AIO:PE-AIO】ゼロクリック時代のテキストエンジニアリング 【第一回】Webサイト回遊の終焉とゼロクリック時代の到来 | AI検索普及で個別Webサイト訪問の必要性が下がる「ゼロクリック時代」において、企業は独自一次情報と信頼性で「真実の単一源泉」となり、AI引用元に選ばれる戦略が必要になると論じている。 | @eitoatsuta | 15:17 |
| 32 | Claude Codeを使い倒すための設定術:CLAUDE.md・自動メモリ・コンテキスト管理の3本柱 | Claude Codeのコンテキストリセットコストを抑えるため、CLAUDE.mdによる文脈共有・自動メモリによる経験蓄積・コンテキスト管理コマンドによるセッション品質維持の3本柱を提案している。 | @tamai_hideyuki | 15:11 |
| 33 | 仕様駆動開発と2026年のAIコーディングエージェント全景 | 持続可能なAIコーディング生産性は、仕様駆動開発と「計画はKiro/日常開発はCursor/コードベース横断はClaude Code」という目的別ツール選定の組み合わせで実現できると論じている。 | @arangott | 14:39 |
| 34 | Snowflake Cortex Agent と Cortex Search を活用したアップセル・クロスセル支援システムの構築 | Snowflake Cortex AgentとCortex Searchで営業向けアップセル・クロスセル支援システムを構築する際、「要素精度を先に確認してから統合する」段階的アプローチを推奨している。 | @dataheroes | 14:26 |
| 35 | Arca の初期動機:agent の作業を repo に残す | 自律開発エージェントの作業をリポジトリにMarkdownで記録し、人間や次のエージェントが継続できるようにする仕組み「Arca」の初期動機と、skill 育成基盤へと拡張した経緯を共有している。 | @sisiodos | 14:23 |
| 36 | Cortex Agent / Analyst における LLM と人間が協調して間違いを検出し、修正する機構 | Cortex Agent/Analystの誤回答を抑えるため、セマンティックビュー整備・VQR蓄積・異常値検知を優先し、データ基盤チームと業務ユーザーの協働で信頼性を担保すべきだと提言している。 | @dataheroes | 14:11 |
| 37 | なぜAnthropicはプロンプトにXMLタグを推奨するのか──Markdownとの構造的な違い | Markdownが人間向け可読性のため曖昧性を構造的に含むのに対し、XMLタグは開始終了が一意で属性によるメタデータも持てるため、複雑コンテキストほどAI解釈精度が上がるとAnthropic推奨の根拠を解説している。 | @yun_bow | 13:37 |
| 38 | Claude Code ハーネスエンジニアリング入門 — まず “整える” から始める | Claude Codeを活かす鍵はモデル選びより環境を整えるハーネスエンジニアリングであり、CLAUDE.mdを軽量に保ちつつコマンドとメモに機能を分散させる3点でモデルの実力を引き出せると説いている。 | @uzero_fktrhori | 12:10 |
| 39 | 『用語を知っている』ことの価値が、AIで消えていく | LLMが技術用語の説明をコモディティ化することで「知っているだけ」の価値は急速に消え、用語の本来の意味を深く理解している人だけが優位性を保てるようになると論じている。 | @rrioh | 11:40 |
| 40 | 土木事業管理 RAGシステム構築ガイド(素案) | 土木分野向けにGraphRAG/VectorRAG/CogGRAGとドメインオントロジーを統合したRAGシステムの設計・実装ロードマップを、PoCから本番運用までと法令体系の整理を含めて素案として提示している。 | @yamamoto_ryuzo | 10:44 |
| 41 | Antigravity刷新でコードエディター選びはどう変わる?4つの入口で整理する | Google I/O 2026刷新後のAntigravityを2.0/IDE/CLI/SDKの4つの入口として整理し、用途別ユーザー像に応じてどこから入るかを選ぶ視点を提示している。 | @sonder01 | 20:26 |
| 42 | Antigravity 2.0 CLI 使ってみた | UnityプロジェクトでAntigravity 2.0 CLI(Gemini 3.5 Flash)とClaude Codeを比較し、Antigravity側が3分1秒で完了するなど速度面で優位だがファイル読み落としを推論で補う傾向があったと検証している。 | @saikoukiroku | 11:58 |
| 43 | Claude Opus 4.7とGPT-5.5 Instantを併用する「三層レビュー」ワークフローを装してみた | 初稿生成をGPT-5.5 Instant、論理レビューをClaude Opus 4.7、3行要約をGemini 3.5 Flashに分担させる三層レビュー構成で品質安定とターンアラウンド2〜3倍短縮を見込めると報告している。 | @kairosai | 08:28 |
| 44 | アインシュタインのAIに「AIの危険性」を講演させたら、Mermaid が現れて― Soul-Twin 講演会機能の設計と5回実験レポート | AIペルソナに連鎖生成で講演させる実験で、前段落のみを渡しても論旨が繋がる現象と、800文字セクションでのみMermaid図が自発的に現れる「800文字閾値」を観察したと報告している。 | @yoshi_katakura | 00:26 |
| 45 | LLM ナレッジグラフ運用 2026 (連載第1部): Karpathy の三層アーキテクチャを 1 ヶ月運用して見えたこと | KarpathyのRaw/Wiki/Schema三層を1ヶ月運用したところ、ハルシネーション率が体感1/10以下に下がりLLMが「思い出す側」から「読む側」に変わったと報告している。 | @znet | 23:09 |
| 46 | LangGraphとRAGで日本株AIデスクを配線する〜 自律型投資エージェント作成記録 #2 | LangGraphで投資テーマを分解し、過去ルールと失敗パターンをRAGで参照、複数データツールで根拠を確認した上でゲートを通すことで、追跡可能な投資意思決定パスを構築する設計を解説している。 | @mikumaitimitan | 23:08 |
| 47 | 生成AIブームという名の「EUC地獄」の再来:DIKWピラミッドから見る、組織知の構造的崩壊 | 概念データモデルを再構築しドメイン間変換規則を整備する泥臭いデータガバナンスに回帰しない限り、どれだけ高性能なLLMを導入しても組織共有知としては機能しないと論じている。 | @ressenti_man | 22:45 |
| 48 | AI時代で返り咲いたtmuxの活用 | tmuxがAIエージェントを並列実行するワークベンチとして再評価されており、Claude CodeのAgent Teamsを含めAIコーディング時代の必須ツールに返り咲いていると論じている。 | @nana | 16:47 |
| 49 | Claude Codeで作る「1人総合商社」 | Claude Codeで副業を自動化するため、3ヶ月の実運用経験をもとに68のカスタムコマンドと29エージェントで一人複数事業を回す「1人総合商社」設計を一冊にまとめている。 | @amu_lab | 12:31 |
| 50 | Linux勢だけどcmuxのターミナル操作機能に興味があったので、再現してみた(オマージュ) | macOS向けcmuxのターミナル操作機能をLinuxで再現するため、bash・jq・tmux・git・coreutilsのみで複数Claude Codeインスタンスを呼び出す軽量な仕組みを実装した経緯を共有している。 | @kay1974 | 21:28 |
| 51 | 複数のAIエージェントを1画面で管理するCLIツールを作った | claude-code/codex/gemini-cliなど複数AIエージェントを1ターミナルで管理し、エディタの作業ディレクトリをアクティブエージェントへ自動追従させるCLIツール「mav」を公開している。 | @k1e1n04 | 20:55 |
| 52 | #1 セッションを閉じたら全部消えた——Claude Codeと長期開発するための設計論 | Claude Codeはセッション間で記憶を保持しないため、CLAUDE.md/backlog.md/MEMORY.mdの3ファイルでタスクを引き継ぐ運用設計が必要だが、ファイル間の整合性維持は今後の課題だと整理している。 | @yuichi1996 | 19:00 |
Qiita
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | Claude Code の Routines と Channels — スケジュール実行の仕組みを公開情報から整理 | AnthropicのRoutines(4月14日発表)とChannels(3月20日発表)を公開情報から整理し、Pro/Max/Enterprise別の日次実行上限や対応プラットフォームを具体的にまとめている。 | @goki602 | 23:56 |
| 2 | Claude Code Routines:Anthropic インフラで動くスケジュール自動化を整理 | Claude Code RoutinesをAnthropic管理インフラで動くスケジュール自動化機能として独立に解説し、ローカル常時起動不要でPro/Maxが3回まで無料試行できる導入経路を提示している。 | @goki602 | 23:49 |
| 3 | AIエージェントの引き継ぎメモを軽くする: WorkBaton と WorkStash の使い分け | A2CRのWorkBatonには短い再開メモを、WorkStashには詳細な補足を保存し、WorkBatonからWorkStashへの参照キーを指す形でAI間引き継ぎを軽量化する運用設計を提案している。 | @a2cr | 22:38 |
| 4 | 【トピックス確認】Gemini Omni Flash 発表 ― 動画生成と会話型動画編集で何が変わりそうか | Google I/O 2026で発表されたGemini Omni Flashが、テキスト・画像・動画・音声を入力に取り会話型で段階的に動画を編集できるマルチモーダルモデルであり、商品説明や教育コンテンツ制作での活用が見込まれると整理している。 | @Tadataka_Takahashi | 22:23 |
| 5 | Claude.ai コネクタ5選——280件から厳選、Claude Code利用者が最初に設定すべきツール | 約280件のClaude.aiコネクタから、Gmail・Google Calendar・Google Drive・Slack・Exaの5つをClaude Codeユーザーが最初に設定すべき土台として厳選し、各41ツールの実運用上の役割を整理している。 | @saitoko | 21:55 |
| 6 | Qwen3.5のモデル構造からMoEを理解する | Qwen3.5のSparse MoE Blockは、Routerによるexpert選択・expertごとの計算・shared expertの共通経路を組み合わせ、入力トークンごとに必要なexpertだけを動かす構造になっていると解説している。 | @camcam | 21:04 |
| 7 | 【MCP自作入門】Notion API × AIエージェントで英語学習の単語登録を全自動化してみた | Python製の自作MCPサーバーとAIエージェントを組み合わせ、記事URLを渡すだけで難単語抽出・意味と例文生成・Notion登録までを自動化し、ハルシネーション混入を検証で防ぐ実装を行ったと報告している。 | @WakoRintaro | 19:42 |
| 8 | 会社員が「空き時間」だけで、SI見積もり1.8億円のシステムをAIと作った話 | 会社員が空き時間だけでClaude等のAIと共同し、SI見積もり1.8億円規模に相当する自動株式取引システムを2年かけて作り上げた経験談として、AIは技術力を増幅する装置であると論じている。 | @engineer-trade | 19:30 |
| 9 | Bedrock Tool Use から Aurora pgvector を直接叩く — Knowledge Bases を使わない RAG の組み立て | BedrockのConverse API+Tool UseからAurora pgvectorを直接叩く自前RAG構成を試し、初回ツール選択精度100%・全クエリ2ターン以内でKnowledge Bases相当の信頼性を達成したと報告している。 | @asahide | 19:45 |
| 10 | AIコーディングツールは「大規模プロジェクト」で違いが出る | AIコーディングツールは小規模タスクでは差が見えにくいが、複数ファイル・依存関係が絡む大規模プロジェクトでは長期コンテキスト維持力の差で性能差が顕在化すると論じている。 | @tuanpk1977 | 18:56 |
| 11 | 視覚障害者による対話型AI観測記 | 視覚障害のある著者が音声のみでAIと対話する観測記録として、自己分析や代名詞使用、役割固定が会話圧力下で徐々に揺れていく現象を捉え、AIが何を最適化しているかを問い直している。 | @777atsushi | 17:48 |
| 12 | 競馬AI予想を「自己学習型」に進化させた話 — 2段推論・コース別バイアス・条件別フィードバックで精度を底上げ | 競馬予想サービス「UmaAI」を改善するにあたり、プロンプト拡大ではなく過去予想精度を注入する自己フィードバックと条件別フィードバックを組み合わせることで予想精度を底上げできたと報告している。 | @travelclass0606 | 15:40 |
| 13 | FunctionGemmaに検索ワードを生成させる | GPU不要の軽量関数呼び出しモデルFunctionGemmaに検索語生成を試したところ、「いい感じのお寿司屋さん」を「おいしい すし屋」にリライトする力は持たず、口語を検索語に変換する用途には不向きだと評価している。 | @kanata564 | 16:30 |
| 14 | エージェントRAGにおける外部知識取り込みの極意:Tool CallingとReActによる自律検索の実装アプローチ | エージェントRAGでは従来の一発検索ではなく、Tool CallingとReActフレームワークを組み合わせLLMが自律的に推論ループと自己修正を行う実装が有効であり、小規模から始めて運用観察で改善することを推奨している。 | @jjking | 08:41 |
| 15 | OpenAI、80年未解決の数学問題を解いたと発表――今度こそ本物か | OpenAIによる「80年未解決の数学問題」発表について、フィールズ賞受賞者を含む数学者たちが今回は支持しており、AI数学研究のマイルストーンになり得るが第三者検証は依然必須だと論じている。 | @quotidia | 07:55 |
| 16 | 【第二回】2026年5月時点のAIコーディングエージェントまとめ | AIコーディングエージェントを比較する際、API課金とサブスク課金は対象が異なるため混同せず、システム統合コストとユーザー向けサブスクを分けて理解すべきだと整理している。 | @ochtum | 06:31 |
| 17 | 【第一回】2026年5月時点のAIコーディングエージェントまとめ | 2026年5月時点のAIコーディングエージェント比較で、料金表は必ず確認すべきだがそれだけでは決めず、トークンコスト・タスク複雑度・成功率・ワークフロー統合のバランスで選定すべきだと論じている。 | @ochtum | 06:08 |
| 18 | 苦手なPythonだけどGemini CLIと強力タッグ!血糖測定器「FreeStyle Precision Neo」のデータ可視化デスクトップアプリを開発し、GitHub Actionsでインストーラー自動ビルドまで実現した話 | Gemini CLIをペアプログラマとして、Python製のFreeStyle Precision Neo用ローカル可視化アプリを開発し、macOS署名とWindows用msi/zipをGitHub Actionsで自動ビルドする構成を完成させたと報告している。 | @twsnmp | 09:37 |
| 19 | WSL2のChromeでローカルGemini(Gemini Nano)を動かす 〜Mesa Dozenにパッチを当ててfullDrawIndexUint32の壁を越える〜 | WSL2のChromeでGemini Nanoをローカル実行するため、競合するLinux GPUドライバを外しMesa Dozenにパッチを当ててfullDrawIndexUint32=trueを返させ、CPUフォールバックを回避したと報告している。 | @MOD_addon_android_htmlcreater | 09:13 |
ITmedia AI+
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | 「Gemini」「Claude Code」「Codex」 全社展開・本番実装に役立つ5つのポイント | Google・Anthropic・OpenAI Japanの3社が共同で語る、Gemini/Claude Code/Codexを全社展開し本番実装に乗せるための5つの実践ポイント(RSFC・.claudeフォルダ・Slack統合・MCP/A2A・LLM Wiki)を整理している。 | - | 08:00 |
GIGAZINE
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | AppleがWWDCに先立ち「Gen AI」(生成AI)用のサブドメインを準備していることが明らかに | Appleがgenai.apple.comサブドメインを登録していることが判明し、6月8日からのWWDC 2026でAIエージェント化Siriや独自生成AIサービス発表に備えている可能性が高いと報じている。 | - | 19:00 |
Publickey
| # | Title | Summary | Author | Published |
|---|
対象日(2026-05-24 JST)に該当する記事はありませんでした。
OpenAI Blog
| # | Title | Summary | Author | Published |
|---|
対象日(2026-05-24 JST)に該当する記事はありませんでした。
Google AI Blog
| # | Title | Summary | Author | Published |
|---|
対象日(2026-05-24 JST)に該当する記事はありませんでした。
Hugging Face Blog
| # | Title | Summary | Author | Published |
|---|
対象日(2026-05-24 JST)に該当する記事はありませんでした。
Simon Willison
| # | Title | Summary | Author | Published |
|---|
対象日(2026-05-24 JST)に該当する記事はありませんでした。
The Decoder
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | ByteDance study finds that asking LMMs questions beats making it transcribe text for long document training(ByteDance研究、長文ドキュメント学習はLMMに転写させるよりQ&Aさせる方が有効) | ByteDance Seedが70億パラメータのMMProLongで、Q&A合成学習が長文理解に有効である一方、純粋な転写学習はかえって性能を下げることを示し、学習長128Kから512Kまでの4倍外挿とMM-NIAHでベース比29.4ポイント向上を達成したと報告している。 | 22:28 |
| 2 | Deepmind’s Hassabis sees humanity “in the foothills of the singularity” while LeCun says current AI isn’t intelligent(DeepMindハサビス氏は人類が「シンギュラリティの裾野」にいるとし、ルカン氏は現在のAIは知性ではないと主張) | DeepMindハサビス氏がAGI到達5年以内かつ「産業革命の10倍を10倍速で」と述べる一方、ルカン氏は「知性とは知らないときに何をするかだ」として現在のLLMを知性と認めず、ヴィニャルス氏は中道を取って両者の評価が大きく割れていると報じている。 | 21:54 |
| 3 | Why you shouldn’t leave model selection on default in Copilot, Gemini and other AI tools(Copilot・Gemini等のAIツールでモデル選択をデフォルトのままにすべきでない理由) | 数学者クチャルスキの実験で、Copilotが同一データを国別ラベルだけ変えた5データセットに対し「イタリア人は英国人の3倍アートに関心」など捏造割合を返す一方、ChatGPT InstantとClaude Opus 4.7は自動で推論モードに入りPythonで重複を検出したと報じている。 | 19:17 |
Hacker News
| # | Title | Summary | Published |
|---|
対象日(2026-05-24 JST)に該当する記事はありませんでした。