AI News Digest: 2026-05-09
Top 20
Fields Medalist says ChatGPT 5.5 Pro delivered “PhD-level” math research in under two hours with zero human help(フィールズ賞受賞者がChatGPT 5.5 ProによるPhD水準の数論研究を検証)
Source: The Decoder | Published: 2026-05-09 23:32 JST
- フィールズ賞受賞者Timothy Gowersが、Mel Nathansonの未解決数論問題(整数和と集合構成)にChatGPT 5.5 Proを2時間以内・人間の介入ゼロで投入し、指数バウンドを多項式バウンドへ改善する結果を得たと報告した
- 元問題は17分5秒で解決され、別途2分23秒で完成版LaTeXプレプリントまで自動生成された
- 一般化版の難問でも、ルーチン改善が16分41秒、新規多項式バウンド突破が31分40秒と所要時間まで明示されている
- レビューを担当したMITの学生Isaac Rajagopal(同問題の一般化に関する先行論文の著者)は、鍵となるアイデアを「completely original」「1〜2週間考えても誇らしい類のひらめき」と評価した
- Rajagopalは結果を「ほぼ確実に正しい」と確認しており、トップ研究者による独立検証付きで「AIが人間補助なしでPhD級数学研究を達成した」最初期の事例として記録された
Claude Mythos徹底解剖:50ドルで27年モノのゼロデイ脆弱性を発見、既存の防壁はなぜ崩壊したか
Source: Zenn | Published: 2026-05-09 21:00 JST
- AnthropicのClaude Mythos(10兆パラメータ級の自律エージェント)が、OpenBSDのTCP selective acknowledgment整数オーバーフロー脆弱性を発見した、と分析した記事
- 該当バグは27年間放置されており、わずか2つのTCPパケットでリモートからカーネルパニックを誘発できる「シーケンス番号が同時に正と負になり得る」整数状態の悪用が指摘された
- 同じ手法でFFmpegの16年モノoob-write(500万回ファジングを生き延びていた)、Firefoxでは181個の自律生成エクスプロイト(成功率72.4%)、Linuxカーネルの権限昇格まで発見された
- Anthropicは12組織と「Project Glasswing」を立ち上げ、ソース修正ではなく環境側の一時パッチで脆弱性発見〜デプロイ間のタイムギャップを埋める運用へ進めている
- 既存のコードレビュー・ファジング・形式検証では検出できなかった事例が複数報告されており、ソースコード全体のセマンティック解析と自走的なエクスプロイト試行が、従来の防壁を機能不全にするレベルに達したことを示した
【神アプデ】AWSが「AI専用API」を無料公開!MCP Server GAでClaude Codeが15,000個のAWS操作を実行する方法
Source: Qiita | Published: 2026-05-09 16:02 JST
- AWS MCP Serverが2026年5月6日にGAされ、Claude CodeやCursorからAWSコンソールを開かずに15,000以上のAWS API操作を直接呼べるようになった
- 利用は完全無料で、課金は実消費されたAWSリソース分のみ。MCPサーバー利用そのものへの追加課金はない
- 認証は標準のAWS CLI認証(環境変数
AWS_ACCESS_KEY_ID/AWS_SECRET_ACCESS_KEYまたは~/.aws/credentials)を流用し、AIアシスタントには鍵自体が渡らない「ゼロクレデンシャル露出」設計 - AWS CLIラッパーと違い、型付きJSONスキーマと動的なドキュメント検索により、エージェントがパラメータをハルシネーションせずに発見できる点が機能差分
- 自然言語指示だけでインフラ管理が可能になるため、「AI専用API」の標準が大手クラウド側からまずAWSによって示された形
Agent Toolkit for AWS が GA されたので VS Code GitHub Copilot から触ってみた
Source: Qiita | Published: 2026-05-09 18:35 JST
- Agent Toolkit for AWSが2026年5月6日にGAされ、AWS MCP Server・Agent Skills・Agent Pluginsの3要素を1つのマネージドエンドポイントに束ねた構成として提供開始した
- これまで
awslabs配下に分散していた個別MCPサーバーを集約し、ドキュメントもサーバー側で常に最新が配信されるため、ローカルキャッシュの陳腐化問題が解消する - IAMには
aws:CalledViaAWSMCP/aws:ViaAWSMCPServiceの条件キーが追加され、ポリシーやCloudTrailで「エージェント発動か人間操作か」を区別できるようになった - VS Code GitHub Copilotからは
.vscode/mcp.jsonにuvxで起動する1ブロックを書くだけで接続でき、call_awsrun_scriptsearch_documentationretrieve_skillなどのツールが即利用可能 - 個別MCP組み合わせから「マネージドAIエージェント基盤」へ移る転換点となるリリースで、AWS側の運用負荷とセキュリティ可視化の両方を一気に整えた
See what happens when creative legends use AI to make ads for small businesses(クリエイティブの巨匠3人が中小企業向け広告をAIで制作する企画)
Source: Google AI Blog | Published: 2026-05-09 00:00 JST
- Googleが広告業界のレジェンド3人を起用した新企画「The Small Brief」を発表、Google AIクリエイティブスタジオ「Flow」を使い米国の中小企業向け広告を制作させる
- 参加クリエイターはJayanta Jenkins(Archangels担当)、Tiffany Rolfe(South Ferry担当)、Susan Credle(Stonewood Farm担当)の3名で、それぞれが地域の中小事業を1社ずつ支援する
- AIツールFlowは「無制限アクセス」で提供され、生成AIで広告を作る際の制約を取り払った状態でクオリティ評価を行うのが企画の主眼
- 公開予定は6月で、完成キャンペーンと制作プロセスの裏側を順次公開する形を取る
- Google側のメッセージは「中小企業がスタジオ品質の広告を独自の声で制作し、新規顧客を見つけ、ワークフローを効率化できる」とAIツールの中小企業向け価値訴求を全面に出した内容
Broadcom reportedly won’t build OpenAI’s custom chip unless Microsoft buys 40 percent of them(BroadcomはMicrosoftが40%購入しない限りOpenAIカスタムチップを製造しないとの報道)
Source: The Decoder | Published: 2026-05-09 19:45 JST
- Broadcomは、第1フェーズで生産する約180億ドル分のOpenAIカスタムチップについて、Microsoftが約40%を購入確約しない限り製造に着手しないとされる
- 対象チップはコードネーム「Jalapeno」で2027年投入予定。背後にある「Nexus」プロジェクト全体ではチップだけで最大1800億ドル、最終的に10ギガワット規模のデータセンター容量を狙う計画
- BroadcomはOpenAIの非公開企業ステータスではファイナンスリスクを取れないため、Microsoftの信用力を実質的な担保として要求している構造
- OpenAIマネージャーSachin Kattiは社内で「Microsoft依存は財務的に不利」と発言したと報じられており、自前ファイナンスへの脱却が課題として明示された
- SoftBankが当初100億ドル予定の融資を60億ドルに減額した件と並ぶ「OpenAIの非上場ステータスがメガディールを難航させた」2例目の事案として位置付けられる
OpenAI gpt-realtime-translate で同時通訳ツールを実装した:踏んだ 4 つの罠
Source: Qiita | Published: 2026-05-09 08:38 JST
- OpenAIが2026年に投入した翻訳特化Speech-to-Speechモデル
gpt-realtime-translateで実装中に踏んだ4つの罠を、同時通訳ツール製作の実体験ベースでまとめた - 罠1: WebSocketサブプロトコルに
openai-beta.realtime-v1を含めると接続が拒否される(GA専用)。罠2: ハートビート判定はフレーム長や振幅閾値ではなく「純粋なゼロ振幅」で判定する必要がある - 罠3: ユーザー側とアシスタント側で独立した無音タイマーを用意しないと、翻訳出力の遅延と入力時間が重なって誤検出になる。罠4: WebRTCではephemeralトークンエンドポイントとレスポンス構造(フラットvsネストJSON)が標準Realtime APIと異なる
- 言語サポートは非対称で、自動検出ソース75言語に対しターゲットは13言語(en, es, pt, fr, ja, ru, zh, de, ko, hi, id, vi, it)のみ、コードはISO 639-1のシンプル形式に固定
instructionsパラメータがなく、文字起こし用のgpt-realtime-whisperが別モデルとして分離されているなど、汎用Realtime APIから「翻訳のみに削り込んだ」設計上の差分が実装ハマりどころとして整理されている
OpenAI Agents SDKのsandbox agentsを触って、現在地を整理する
Source: Zenn | Published: 2026-05-09 15:56 JST
- OpenAI Agents SDKに4月15日追加されたsandbox agents、およびTypeScript対応が5月6日に追従したことを受け、現在のSDKの設計上の現在地を整理した記事
- 変化1: エージェントがホストファイルシステムから独立したワークスペースを持ち、実ファイル操作とコマンド実行を自律的に行えるようになった
- 変化2: マニフェストベース構成によりinstructionsと作業対象が分離され、独立に管理可能に。変化3: ハーネス(行動制御)とサンドボックス(作業環境)が別レイヤに分離されモジュラー設計が可能になった
- 著者の評価は「自律エージェントの基礎設計」段階であり、本番投入向けにはクラウドストレージ統合の機能不足やネットワーク隔離オプションの不足など制限がまだ残る
- SDKの位置付けは「プロンプトを書く」から「ワークスペース・ツール・権限・記憶・ランタイムを設計する」へと移ったとし、Agents SDK全体が設計対象を広げている戦略的シフトを示している
RAGに「どこを見るか」を判断させる Agentic RAGの3つのアーキテクチャパターン
Source: Zenn | Published: 2026-05-09 15:32 JST
- 従来RAGの「ベクトル化→類似検索→生成」固定パイプラインに対し、エージェントが質問を分析してから検索戦略を立てるAgentic RAGの3パターンを提示する整理記事
- パターン1「Single Agent」は1エージェントが複数ツール(vector/keyword/graph/web)を切り替える最小構成で、技術ドキュメント・社内FAQなど中小プロジェクト向け
- パターン2「Multi-Agent Collaborative」はResearchAgent / PractitionerAgent / AnalysisAgent等の専門エージェントとオーケストレータの分業で、専門領域横断型に向く
- パターン3「Hierarchical」はMaster→Domain Supervisors→Specialistsの階層構造で、エージェント単位の権限管理(例: 法務エージェントは契約書のみアクセス)を要するエンタープライズ向け
- 実装注意点として、コストが3〜5倍になるため戦略立案には安価モデル・最終回答にプレミアモデルといったモデル階層化、ループ上限〜3回、トレース基盤の即時整備を強く推奨
対話駆動仕様開発 isdd: 非エンジニアが要件を握って、堅実に動くソフトを作る(究極の市民開発)
Source: Qiita | Published: 2026-05-09 21:06 JST
- 著者は「AI実装で一番つらいのは、速く作れることではなく、後で壊れること」とし、要件・設計・コードを意味的IDで連結する開発手法isdd(Interview-driven Spec-driven Development)を提案した
- IDは連番ではなくセマンティックスラッグ(
RQ-[CATEGORY]-[CONTENT]/DS-[TYPE]-[CONTENT]-[RQ-REF])を使い、機械可読なトレーサビリティを担保する設計 - 対象は非エンジニアと市民開発者で、要件レビューを非エンジニアが、設計レビューを画面/UI観点で、コード検証を自動トレーサビリティチェックでと役割分割する
- 完了基準にE2Eシナリオを置き「動いているように見えるが要件未実装」を排除する仕組みを採用、
rq_integrity_checker.pyrq_ds_link_checker.pyなどの自動検証スクリプトで人手レビューの抜けを潰す - 「AIで速く作る」が普及した結果として浮上した「AI実装が後で壊れる問題」に対し、要件・設計・コードの3層を意味IDで縛る方法論として記事を読むと位置付けが明確になる
LLMエージェントはなぜ壊れるのか ——モデル性能に依存しない自律型ワークフローの構築
Source: Zenn | Published: 2026-05-09 21:10 JST
- LLMエージェントの不安定性の根本原因は推論能力ではなく「状態管理」と「世界構造」の欠如にあると主張する28,958字の無料公開書籍
- 提案するのは「LLMをステートレスな推論エンジンとして扱い、設計したパラメータ内に閉じ込める」アプローチで、コンテキスト設計(プロジェクト前提の圧縮)と外部状態管理(タスク進捗を外部ファイルへ)を二大要素として位置付ける
- 推奨アーキテクチャは外部化ワークフロー型で、タスク進捗をモデル記憶ではなく外部ファイルに記録し、システム全体を「安全で安定したステートマシン」として動かす
- モデル性能の改善ではなく状態管理の設計優先という主張は、巨額のモデル学習投資に依存しないエンジニアリング側の解として注目される
- 全3章構成で、なぜエージェントは壊れるか/コンテキスト設計/ワークフロー外部化原則という構成を取り、現場エンジニア向けの実装指針を含む
【アーキテクチャ設計】「RAG=AIの長期記憶」という落とし穴。LLMエージェントにおけるMemoryとRAGの境界線
Source: Qiita | Published: 2026-05-09 17:45 JST
- 「RAGをAIの長期記憶として使う」という設計が頻発するが、実際にはRAGはステートレスな知識検索エンジンであり、状態継続性を担保できないと整理した記事
- RAGの責務はマスターデータ検索(マニュアル/規程の静的検索)、Memory層の責務はユーザーセッション状態管理(ID・嗜好・タスク進捗・複数セッションをまたぐ継続性)と明確に分離
- 「両方ともプロンプトに動的に情報を注入する」という共通点が混同を招くが、根本的に異なるアーキテクチャ責務であり、両者を1層に押し込むと運用崩壊する
- 推奨構成は両層を分離して持ち、Memory層が現在のユーザー状態に基づいてRAGの検索クエリを生成する「Memory-informed RAG」型
- パーソナルアシスタント・複数週タスクのマルチエージェント・継続学習型システムでは特にMemory層の独立実装が必須、というユースケース別の判断基準も明示した
LLMから呼ばれるアプリをMCPファーストで設計するときの3つの原則
Source: Zenn | Published: 2026-05-09 19:28 JST
- 著者がCLO(Chief Logistics Officer)意思決定支援アプリを3回設計し直して導いた、LLMから呼ばれるアプリのMCPファースト設計3原則を整理した記事
- 原則1「Thin Interface Layer」: 判断ロジックを画面・REST・MCPのいずれにも書かず中核ロジックに集約する。原則2「Multi-Format Output from Start」: PowerPoint/Word/Excel/Markdown等のドキュメント出力をプライマリ成果物として最初から設計
- 原則3「Structure Return Values with Evidence」: 戻り値にスコアだけでなく出典・根拠・棄却した代替案を含める。LLMはUI tooltipを見られないため、構造化エビデンスがなければ判断ができない
- 最終的にCLOアプリは12のMCPツールで構成され、すべてが共有コアロジックを呼び出すことでMCP/REST/Webから等しい振る舞いを担保した
- アンチパターンは「規制判断ロジックをReactコンポーネントに直書きする」設計で、結果として「画面では出ているはずの注釈がMCPからは出てこない事故」が発生するため、MCP前提の設計順序を逆転させる必要があると主張する
2026年4月のLLMアップデートラッシュを振り返る
Source: Qiita | Published: 2026-05-09 21:04 JST
- 2026年4月のLLM主要アップデートを、クローズド・オープンウェイトの両軸で時系列に整理した振り返り記事
- クローズド側: 4/2 Gemini 3.1 Flash TTS、4/16 Claude Opus 4.7(コーディング・長時間タスク強化)、4/16 OpenAI Codexメジャーアップデート(PC操作/ブラウザ統合/PRレビュー)、4/21 GPT Image 2、4/21 Google Deep Research Max、4/23 OpenAI GPT-5.5
- オープンウェイト側: 4/2 Gemma 4、4/7 Z.ai GLM-5.1、4/15 Alibaba Qwen3.6-35B-A3B(35B MoE/3B active)、4/20 Moonshot Kimi K2.6(1T MoE)、4/22 Qwen3.6-27B、4/24 DeepSeek-V4(1Mコンテキスト)、4/29 Mistral Medium 3.5(128B dense)
- 評価軸が「素のモデル性能」から「ツール・インターフェース・エージェント能力含めた業務統合容易性」へ移ったことを明示した
- オープンウェイト側はQwen/DeepSeek/Gemma/Kimiが「業務利用に耐える」サイズで4月だけで複数リリースされ、クローズド独占の構図が崩れる兆候として整理されている
AIエージェント時代に事業価値はどんな影響を受けるか — 4 ドメイン × 3 区分で分解する枠組み
Source: Zenn | Published: 2026-05-09 16:58 JST
- AIエージェント時代の事業価値変動を「4ドメイン×3区分」フレームで整理した記事で、画一的な戦略提示ではなくドメインごとの差分分析を主眼とする
- 3区分は「Diminishing(消える既存価値)」「Strengthening(既存資産で強化される価値)」「Emerging(エージェント時代に新登場する価値)」の3層
- 4ドメインはMatching Platforms / B2B SaaS / B2C Apps / Mediaで、それぞれの収益構造に対しエージェント介在による変動を当て嵌める
- MCPサーバー提供は「自社SaaS機能を外部エージェント(Claude/Cursor/Gemini CLI)から呼び出せる窓口を作る方向性」と位置付け、Apps SDKは「ChatGPT内にUIを埋め込む」流通チャネル拡張と分けて分析
- CanvaとZillowをApps SDK採用のB2C代表として挙げ、MCP対応=API信頼性競争、Apps SDK対応=新規流通チャネル獲得、と戦略目的の違いを明確化した
Harness Engineering とは何か ― 2026年2月から90日で業界共通語になった概念の正体
Source: Zenn | Published: 2026-05-10 00:58 JST
- Harness Engineeringは2026年2月5日にHashiCorp共同創業者Mitchell Hashimotoが命名した概念で、90日でOpenAI・Anthropic・LangChain・Martin Fowler・Ethan Mollick等が一斉に採用し業界共通語化したと整理する
- 中核原則は「エージェントが間違いを犯したと気付く度に、二度と同じ間違いを犯さないよう仕組みを設計せよ」、定式化は「Agent = Model + Harness」
- ハーネスは事前制約のGuides(AGENTS.md、システムプロンプト、ルール)と事後検証のSensors(リント、テストスイート、CI/CDゲート、kill switch)の2要素から成る
- AIエージェントの信頼性はモデル性能ではなく統制環境(ハーネス)に依存する、というモデル偏重への明確な反論として位置付けられている
- 実証例として、OpenAIではエンジニア3人がCodexエージェントで約100万行のプロダクションコード(手書きゼロ)と1500件のPR運用を達成、ハーネス強化が大規模AI開発を可能にした実例として引用される
Claude Codeのフック5個で「うっかり事故」を本気で潰した話
Source: Qiita | Published: 2026-05-09 15:22 JST
- Claude Codeの危険操作を「書面のお願い」では約20%失敗するため、コード化したフック5個で物理的にブロックする実装を公開した記事
- 構成は guard-bash.sh(危険bash遮断)、guard-secrets.sh(機密ファイルアクセス防止)、lint-after.sh(ポスト編集リント)、notify.sh(停止通知)、settings.local.json経由のPre-Tool Validationの5本立て
- ブロック対象正規表現は
rm -rf /、git push --force(mainブランチ)、sudo rm、chmod 777、curl | shなどの典型的破壊コマンド - 実装はJSONベースで
{"decision":"block","reason":"..."}を返してClaude Codeに具体的な拒否理由を伝える方式、stdin入力をjqで検証してパスのセキュリティパターンと突き合わせる - 「書面ルールでは止まらない、フックで止める」という運用原則の実証として、Claude Codeにおけるエンジニアリング統制の最低限ベースラインを示す事例
Chromeの「オンデバイスAI」がGoogleサーバーにデータを送信していないという主張を削除
Source: GIGAZINE | Published: 2026-05-09 21:00 JST
- ChromeのオンデバイスAI(Gemini Nano)が「Googleサーバーにデータを送信しない」とする説明文がChrome 147から148(5月5日リリース)にかけて静かに削除された
- 削除はRedditのChromeコミュニティが新旧スクリーンショット比較で発見し、Hacker News経由で広く拡散され、Googleが新たなデータ収集を開始するのではという批判が噴出
- Googleの広報説明は「データ自体はオンデバイス処理のまま変化なし。ただしWebサイト経由でAI入出力を使う場合、データはサイト独自プライバシーポリシー側に流れる」ため明示文を削除し「混乱を避ける」ため、というもの
- Googleが言うところの「Googleサーバーには送らない」は事実だが、Webサイトが収集する経路が残っており、ブラウザベンダーの保証ではユーザーを守れないことが浮き彫りになった
- AIブラウザ機能におけるプライバシー説明の責任境界が「ベンダー vs Webサイト」のどちらにあるかという問題を、現実のリリースで顕在化させた事例
Using Claude Code: The Unreasonable Effectiveness of HTML(Claude Codeで HTML出力を要求することの「不合理なほどの有効性」)
Source: Simon Willison | Published: 2026-05-09 06:00 JST
- Anthropic Claude CodeチームメンバーThariq Shihiparが、Claudeへ Markdownではなく HTMLを要求する方が圧倒的に表現力が上だと主張する記事をSimon Willisonが取り上げて整理した
- Markdownはコンテキスト制限が厳しかったGPT-4時代に最適化された出力形式であり、現在のClaudeに対しては HTMLでSVG図・インタラクティブウィジェット・ページ内ナビゲーションまで生成させた方が情報の可読性が大幅に上がる
- 具体例として「PRレビュー用 HTMLアーティファクト」プロンプトでは、実差分とインライン注釈を埋め込み、検出事項を重大度別に色分けした成果物を生成
- Simon Willison自身がcopy.fail掲載の難読化Pythonエクスプロイト(Linux権限昇格)を Claudeに HTMLで解析させ、構造化された解説・パターン分析・インタラクティブスタイルでの可視化に成功したと検証した
- 実用Tipsレベルの記事ではあるが、Claude/コーディングAIに対するデフォルト出力形式選定の常識を書き換えるインパクトを持つ実装ノウハウとして注目された
Claude Codeから株価17,000銘柄を自然言語で叩く——Financial Datasets MCP接続手順
Source: Qiita | Published: 2026-05-09 23:02 JST
- Financial Datasets MCPはClaude Code/Claude Desktop/Cursorに対しリモート接続でき、米国上場17,000銘柄(廃止銘柄含む)の財務データを自然言語クエリで叩けるサービス
- 認証はOAuthベースで、Claude Code内
/mcp実行でブラウザ認証フローへ遷移、APIキーの手動管理不要。直接REST API利用時のみX-API-KEYヘッダ必要 - セットアップは
claude mcp add --transport http financial-datasets https://mcp.financialdatasets.ai一発(コマンド構文は<name>を--transportの前に必置、https://省略は「Invalid URL」エラー) - 実用例: Apple営業利益率トレンドvsMS/Amazonの4四半期比較が約1.5秒、NVIDIA月次ボラティリティ約2秒、Tesla 8-K 3行要約も即時レスポンス、と具体時間まで提示
- 「無料」のラベルとは裏腹に earnings $0.01/req、balance sheet $0.04/req のクレジット消費型で、初期クレジットは約100問で枯渇する。Pro KPI(Guidance/non-GAAP)は$200+/月、日本株・国際市場・暗号資産の本格カバレッジは無し、という制約も明示
All Articles
Zenn
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | Harness Engineering とは何か | Hashimoto命名のAgent=Model+Harness概念が90日で業界共通語化した経緯と中身 | @zztomcat | 00:58 |
| 2 | Claude Mythos徹底解剖 | Mythosが2 TCPパケットでOpenBSD 27年モノkernel panicを発見した分析 | @lumichy | 21:00 |
| 3 | LLMエージェントはなぜ壊れるのか | 不安定さは状態管理欠如が原因と論じる無料書籍(28,958字) | @naoyoshinori | 21:10 |
| 4 | AIエージェント時代に事業価値はどんな影響を受けるか | 4ドメイン×3区分でMCP/Apps SDK採用の戦略目的の違いを分解 | @biscuit | 16:58 |
| 5 | OpenAI Agents SDKのsandbox agentsを触って、現在地を整理する | sandbox agents追加とTS対応で「ワークスペース設計」へ移った現在地分析 | @松尾淳平 | 15:56 |
| 6 | RAGに「どこを見るか」を判断させる Agentic RAGの3つのアーキテクチャパターン | Single/Multi-Agent/Hierarchicalの3パターンと選定基準を整理 | @井本 賢 | 15:32 |
| 7 | LLMから呼ばれるアプリをMCPファーストで設計するときの3つの原則 | CLO意思決定SaaSを3回設計し直して導出したMCPファースト3原則 | @ykenk | 19:28 |
| 8 | 今日からできるAIワークフロー設計シリーズ | LLM本番投入のための境界・検証・監査・段階展開の9パターン解説 | @かなりあ | 19:35 |
| 9 | Claude Code のエージェントを3人に分けた話 | Architect/Implementer/Reviewer分業で自己レビューバイアスを潰した実践 | @テクノビビ | 21:18 |
| 10 | Claude Code の known-failures.md を育てる | 失敗ログをセッション越しに読まれるコンテキストとして育てる運用設計 | @ojt | 20:22 |
| 11 | C-3PO、自己観測と学習の輪を閉じる | claude-code-conductorにDuckDB+Thompson Samplingで自己学習ループを閉じた更新 | @satoh-y-0323 | 20:15 |
| 12 | ルール準拠を自動チェックする(後編) | git diffをルール別サブエージェント並列で検査する /rules-review skill | @hiropon | 翌00:00 |
| 13 | APIUserAbortError extends APIError を知らずにCIを1件落とした話 | OpenAI SDKでサブクラスより親 instanceofを先に書きCIが落ちた事故と修正順 | @Iori | 21:00 |
| 14 | Claude MCPサーバー自作ハンズオン|TS版・公開まで | TypeScriptでMCPサーバーを初期化からnpm公開まで通すハンズオン | @蒼井 詠 | 20:49 |
| 15 | Claude MCPサーバー自作キット|日本語PDF+雛形4種 | Node.js/TS雛形4種+日本語PDFのMCPサーバー自作キット | @蒼井 詠 | 20:48 |
| 16 | ISUNARABE合同演習2026とかいう最高のイベントに参加してきた | AI制限なしISUCONで0点惨敗、「思考は外注できるが理解はできない」教訓 | @rail44 | 23:29 |
| 17 | アメコミ原書を読むためのGeminiを使った「翻訳サーバー」を構築した話 | Gemini 3.1 Flash Lite Previewで画像送信→キャラ口調反映の翻訳サーバー構築 | @Percy | 14:50 |
| 18 | LINE連携AIアプリをフルスタックで開発 | LINEミニアプリ+チャットボット+LLMでゴルフAI日記をGoで構築 | @SatoshiTech | 10:54 |
| 19 | Local VLMのOCR性能評価を行う | Gemma4/Qwen3.5-VL/MiniCPM/InternVL3.5をOllamaで評価しQwen3.5-VL最高 | @Dr. BobT | 14:52 |
| 20 | 最近のAIニュース、ちょっと多すぎる気がしませんか? | 北京国際映画祭AIGC部門新設等を含む週次AIニュース個人まとめ | @多田悠 | 16:55 |
Qiita
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | Claude Codeから株価17,000銘柄を自然言語で叩く——Financial Datasets MCP接続手順 | 17,000銘柄を自然言語で叩けるFinancial Datasets MCPの設定手順と$0.01/req実態 | @daisuke-nagata | 23:02 |
| 2 | 対話駆動仕様開発 isdd: 非エンジニアが要件を握って、堅実に動くソフトを作る | 要件・設計・コードを意味的IDで連結する市民開発向け方法論isddの全体像 | @notfolder | 21:06 |
| 3 | 2026年4月のLLMアップデートラッシュを振り返る | 4月のクローズド・オープンウェイトモデル全リリースを日付付きで列挙 | @camcam | 21:04 |
| 4 | 「RAG=AIの長期記憶」という落とし穴。LLMエージェントにおけるMemoryとRAGの境界線 | RAG(マスターデータ)とMemory層(セッション状態)の責務分離を明示 | @memorylakeai | 17:45 |
| 5 | Agent Toolkit for AWS が GA されたので VS Code GitHub Copilot から触ってみた | MCP Server+Skills+Pluginsを束ねたAgent Toolkit for AWSのVS Code接続手順 | @leomarokun | 18:35 |
| 6 | 【神アプデ】AWSが「AI専用API」を無料公開!MCP Server GAでClaude Codeが15,000個のAWS操作を実行する方法 | AWS MCP Server GA(5/6)の概要と無料・15,000 API・ゼロクレ露出設計 | @emi_ndk | 16:02 |
| 7 | Claude Codeのフック5個で「うっかり事故」を本気で潰した話 | 危険bash・機密ファイル・lint・通知の5フックでClaude Code事故をブロック | @Ngen | 15:22 |
| 8 | 「設定したのになぜ?」Claude Codeのパーミッションが効かない理由と、今すぐできる対策 | 厳密文字列マッチでパイプ・複合コマンドが弾かれる原因と Hookでの回避策 | @enomoso_pm | 23:08 |
| 9 | Claude Mythos徹底解剖(Qiita版) | Zenn版と同内容の Claude Mythos OpenBSDゼロデイ発見分析の Qiita再掲 | @lumichy | 21:05 |
| 10 | グラフより面積で「第一種・第二種の過誤」を 2×2 で表現してみた | AI協働で第一種・第二種過誤を面積比2×2で可視化する代替表現の試作 | @sasailab | 16:20 |
| 11 | Midnight AI Groove 26-04-21 | DJスタイルでAIニュース 4/21分を会話形式でレビューする週次企画 | @masykot582 | 23:05 |
| 12 | ラッコキーワードが高いので、同じSEOサービスをClaudeCodeで作ってみた | 有料SEOツール代替を Claude Code+APIで素人が個人開発した実装報告 | @kazukichi | 22:09 |
| 13 | 【2026年最新】AI系Macアプリのbrewコマンドまとめ | 2026年5月時点のAI系macOSアプリ Homebrewインストール一覧 | @koheisato | 21:28 |
| 14 | 自律型AIエンジニアを自作してみたが使うまでには至らなかった | 自作自律AIエンジニアの実装記録と「実用に至らなかった理由」考察 | @takiguchi-yu | 13:31 |
| 15 | 「デザイン×コード」を一撃出力する黄金プロンプト | Geminiでプレーンになりがちな LP生成を最適化する単一プロンプト | @devet-official | 17:05 |
| 16 | 「要件を1つにまとめろ」と言い出したAIエージェントとの付き合い方 | Claude Codeが「要件を1件にまとめろ」と要求してくる挙動への対応経験談 | @t7u-ito | 14:01 |
| 17 | Geminiで彗星と遊ぶ魔法少女を描いてみた | Geminiの画像生成で「彗星と魔法少女」を描かせた作例 | @nori-channel | 14:01 |
| 18 | Google AI StudioでVibe Codingして、ガチャアプリをつくっちゃえ☆彡 | Google AI StudioのBuildモードでガチャアプリをプロンプトのみで実装 | @usaminanana | 09:58 |
| 19 | 自作小説100万文字をMCPサーバー化して、ClaudeAIに自律検索させた話 | 自作小説100万字を MCP化し ClaudeAIに自律的に参照させる実装 | @pyuruco | 10:02 |
| 20 | Hermes Agent + 3つのMCPで不動産データAIコンサルエージェントを作ってみた | MLIT/e-Stat/e-Govの3 MCPで日本不動産AIコンサルを15秒応答で構築 | @takurot | 14:02 |
ITmedia AI+
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| - | (該当記事なし) | 2026-05-09付のAI関連記事はフィードに無し | - | - |
GIGAZINE
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | 「執筆に生成AIを使った疑い」で大手出版社がホラー小説の出版を中止 | Hachetteが Mia Ballard著「Shy Girl」をAI執筆疑惑で出版中止、英作家協会は「人間執筆」ロゴ開始 | - | 22:00 |
| 2 | Chromeの「オンデバイスAI」がGoogleサーバーにデータを送信していないという主張を削除 | Chrome 148で「Googleに送らない」明記が消失、Webサイト経由データ流出責任の境界が問題化 | - | 21:00 |
Publickey
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| - | (該当記事なし) | 2026-05-09付のAI関連記事はフィードに無し | - | - |
OpenAI Blog
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| - | (該当記事なし) | 5/8 12:30 GMT「Running Codex safely at OpenAI」は5/8 JST扱いで対象外 | - | - |
Google AI Blog
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | See what happens when creative legends use AI to make ads for small businesses(中小企業向けAI広告制作企画 The Small Brief) | Jenkins/Rolfe/Credleの巨匠3人がFlowで中小3社の広告を制作、6月公開予定 | - | 00:00 |
Hugging Face Blog
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | EMO: Pretraining mixture of experts for emergent modularity(EMO: 創発的モジュラ性のためのMoE事前学習) | Ai2が14B/8active EMOで12.5%エキスパート使用時も性能劣化〜3%に抑制、ドメイン別自然分化を達成 | - | 01:03 |
Simon Willison
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | Using Claude Code: The Unreasonable Effectiveness of HTML(Claude Codeに HTML出力を要求することの不合理なほどの有効性) | Anthropicの Shihiparが Markdown→HTML出力推奨、SVG/インタラクティブ要素まで生成可能と例証 | @simonw | 06:00 |
The Decoder
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | Fields Medalist says ChatGPT 5.5 Pro delivered “PhD-level” math research in under two hours with zero human help(フィールズ賞Gowersが ChatGPT 5.5 Pro PhD級数論研究を検証) | Gowersが ChatGPT 5.5 Proで Nathanson未解決問題を17分5秒で多項式バウンド改善、MIT検証で正当 | - | 23:32 |
| 2 | Broadcom reportedly won’t build OpenAI’s custom chip unless Microsoft buys 40 percent of them(BroadcomがMS 40%購入なしでは OpenAIチップ製造拒否との報道) | 第1フェーズ$18Bのうち40%をMSが買わない限り Broadcomは Jalapeno製造に着手しないと報道 | - | 19:45 |
Hacker News
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| - | (該当記事なし) | hnrss検索クエリの結果に対象日 AI/LLM関連記事は無し | - | - |