AI News Digest: 2026-05-20
Top 20
Google、“動画版Nano Banana”こと「Gemini Omni」公開 会話で映像を生成・編集
Source: ITmedia AI+ | Published: 2026-05-20 03:38 JST
- Google I/O 2026で、自然言語の対話だけで動画を生成・編集できるマルチモーダルモデル「Gemini Omni」を発表した。
- テキスト指示で映像の生成から修正までを一貫して行え、「動画版Nano Banana」と位置付けられている。
- 静止画生成で評判を得たNano Bananaの操作感を動画領域に拡張する狙いがある。
- 開発元はGoogle DeepMindで、推論能力を活かした対話的な映像編集が特徴とされる。
- Flow(映像制作)やYouTubeショートのリミックスなど複数プロダクトへの統合が同時に告知された。
Gemini 3.5: frontier intelligence with action
Source: Google AI Blog | Published: 2026-05-20 02:45 JST
- Googleが最新モデル系列「Gemini 3.5」をI/Oで正式発表し、フロンティア級の知能と自律行動(action)を組み合わせたと位置付けた。
- 軽量版「Gemini 3.5 Flash」が即日提供され、高性能版「Gemini 3.5 Pro」は6月公開予定とされる。
- 単に質問に答えるだけでなくタスクを実行する「エージェント的」性能を前面に押し出している。
- Search、Workspace、Geminiアプリなどgoogle製品群への横断的な組み込みが予定されている。
- 同日のSpark(常駐エージェント)やOmni(動画生成)と合わせ、エージェント時代への移行を強調した。
Google「25年で最大の刷新」 AI検索、新モデルで”OpenAI対抗”鮮明に【発表まとめ】
Source: ITmedia AI+ | Published: 2026-05-20 16:35 JST
- Googleが新モデル「Gemini 3.5」、AI検索の機能強化、AIエージェントツールを一挙発表し、OpenAIへの対抗姿勢を鮮明にしたと報じている。
- 検索は「25年で最大の刷新」と位置付けられ、マルチモーダル入力とエージェント機能を取り込んだ。
- I/O 2026での主要発表を横断的にまとめた記事で、製品横断のAI強化が柱となっている。
- 新モデルとエージェントツールを組み合わせ、検索体験そのものを再設計する方針を示した。
- 一連の発表はGeminiブランドを軸にしたエコシステム統合という戦略を裏付けている。
An OpenAI model has disproved a central conjecture in discrete geometry
Source: OpenAI Blog | Published: 2026-05-20 00:00 JST (OpenAIのモデルが離散幾何学の中心的予想を反証した)
- OpenAIのモデルが80年来の「単位距離問題」を解き、離散幾何学の主要な予想を反証したと発表した。
- AIが数学研究で実質的な新発見に到達したマイルストーンと位置付けている。
- 既存の予想を覆す結果であり、AIによる定理発見・反例構成の能力を示す事例とされる。
- 単なる計算補助ではなく、未解決問題に対する数学的貢献である点を強調している。
- AI駆動の数学研究という方向性での進展を象徴する成果として公開された。
Google、「Antigravity 2.0」発表。デモとしてゼロからOSを開発、Doomも実行可能に。効率性と高い開発能力をアピール
Source: Publickey | Published: 2026-05-20 11:30 JST
- GoogleがI/O 2026で「AIエージェントファースト」の開発環境「Antigravity 2.0」を発表した。
- 複数のAIエージェントを協調させ、デモではゼロからOSを開発しDoomを動作させてみせた。
- 効率性と高い開発能力を実証する目的で、実際に動くソフトウェアを生成する様子を示した。
- AIエージェントが開発作業の主体となる環境設計を前面に出している。
- 同日にはAndroid開発向けの「Android Knowledge Base」「Android Skills」の追加も告知された。
Deepseek wants to take on Claude Code and OpenAI’s Codex with “Deepseek Code”
Source: The Decoder | Published: 2026-05-21 03:48 JST (DeepseekがClaude CodeとOpenAIのCodexに「Deepseek Code」で対抗)
- DeepSeekが独自のAIコードエージェント「Deepseek Code」を開発するため北京に専門チームを立ち上げたと報じている。
- Claude Code、Codex、Cursorへの直接的な競合として位置付けられている。
- 求人ではagent loop・MCP・コンテキストエンジニアリングの経験が求められている。
- 既存のコーディング開発ツールへの精通も応募要件に挙げられている。
- 中国勢がコーディングエージェント市場へ本格参入する動きを示す事例である。
「Gemini 3.5」登場 軽量モデルは一部3.1 Pro超え、高性能モデルは6月公開予定
Source: ITmedia AI+ | Published: 2026-05-20 09:02 JST
- GoogleがGemini 3.5系列を発表し、軽量版Flashが即日提供、高性能版Proが6月公開予定であると報じている。
- 軽量モデルの「Gemini 3.5 Flash」は一部指標で前世代の3.1 Proを上回るとされる。
- 高性能モデル「Gemini 3.5 Pro」のリリースは6月に予定されている。
- 軽量モデルの性能向上により、コスト効率の高い用途で前世代上位機を代替できる可能性がある。
- I/O 2026の中核発表として、モデル系列の世代更新を具体的な性能差分とともに示した。
Stability AI launches Stable Audio 3.0 with up to six-minute tracks and open weights
Source: The Decoder | Published: 2026-05-20 23:59 JST (Stability AIが最長6分・オープンウェイトのStable Audio 3.0を公開)
- Stability AIが、最長6分の楽曲を生成できる「Stable Audio 3.0」を発表した。
- 新モデルのうち3つはオープンウェイトとして公開される。
- 学習にはライセンス取得済みの音源のみを使用したと同社は明言している。
- 従来より長尺の楽曲生成に対応した点が主要なアップデートである。
- オープンウェイト提供により、開発者が自前環境で音楽生成を組み込める余地が広がる。
GoogleのModern Web Guidanceスキル登場。AIが古いCSS・JSを書く問題を解決する
Source: Zenn | Published: 2026-05-20 21:51 JST
- GoogleがAIエージェント向けの「Modern Web Guidance」スキルを公開し、AIが古いCSS・JavaScriptを書く問題への対処策になると解説している。
- AIはSubgridやObject.groupByなどモダンな手法を提案せず、旧来パターンを出力しがちだと指摘する。
- アクセシビリティやセキュリティ面の考慮が抜け落ちる傾向にも触れている。
- スキルとして配布することで、エージェントの生成コードを最新のWeb標準に寄せる狙いがある。
- はてなブックマーク53件と本日の技術記事で最も注目を集めた。
Google’s Gemini 3.5 Flash follows Anthropic and OpenAI in making newer AI models significantly pricier
Source: The Decoder | Published: 2026-05-20 19:40 JST (GoogleのGemini 3.5 FlashもAnthropic・OpenAIに続き新モデルを大幅値上げ)
- Gemini 3.5 Flashは性能向上と引き換えに、実行コストが従来比で5.5倍になったと報じている。
- エージェント型タスクではGemini 3.1 Proより約75%高いコストがかかるとされる。
- 巨額のインフラ投資回収を背景に、業界全体で新モデルが高額化する流れを反映している。
- Anthropic・OpenAIに続く値上げであり、「Flash=低コスト」という前提が崩れつつある。
- 性能だけでなく運用コストでのモデル選定が重要になることを示している。
Andrej Karpathy picks Anthropic over former home OpenAI to get back into frontier LLM research
Source: The Decoder | Published: 2026-05-20 03:23 JST (著名研究者カーパシーが古巣OpenAIではなくAnthropicを選びフロンティアLLM研究に復帰)
- 著名AI研究者アンドレイ・カーパシーが、研究開発のためAnthropicに加わったと報じている。
- 元OpenAI・Teslaのメンバーである彼が古巣OpenAIへの復帰ではなくAnthropicを選んだ点が注目されている。
- フロンティア言語モデル研究への復帰であり、OpenAIにとっては人材流出を意味する。
- 同件はITmediaでも本人のSNS投稿として報じられている。
- 主要研究者の移籍はAI企業間の人材争奪戦の激化を象徴している。
APIコール一発でGoogleがホストするLinux環境付きのAIエージェントを起動、Markdownでカスタム指示もできる「Managed Agent API」発表
Source: Publickey | Published: 2026-05-21 00:21 JST
- GoogleがI/O 2026で、API1回の呼び出しでGoogleホストのリモートLinux環境付きAIエージェントを起動できる「Managed Agent API」を発表した。
- カスタム指示はMarkdown形式で与えられる。
- 開発者は実行環境の構築なしにエージェントを動かせる点が特徴である。
- Gemini APIの拡張としてマネージドな実行基盤を丸ごと提供する形になる。
- エージェント運用のインフラ負担を下げ、導入の敷居を下げる狙いがある。
Appleが5年がかりで開発したセキュリティ対策を5日で突破 「Mythos」が見せつけた脆弱性攻撃の威力
Source: ITmedia AI+ | Published: 2026-05-20 06:00 JST
- セキュリティ企業Califが、Appleの先進的セキュリティ機構「MIE」を「AnthropicのAIモデルのプレビュー(Mythos)」を用いて5日で突破したと公表した。
- Appleが5年がかりで開発した対策を、わずか5日で回避できたことが示された。
- AIが脆弱性攻撃(エクスプロイト)の開発能力を持つことを実証した事例である。
- 防御側・攻撃側双方でAIが現実的な脅威・武器になり得ることを浮き彫りにした。
- はてなブックマーク9件と、本日のセキュリティ系記事で関心を集めた。
OpenAI、Googleの「SynthID」を採用 「C2PA」と組み合わせAI生成画像の来歴証明を強化
Source: ITmedia AI+ | Published: 2026-05-20 04:55 JST
- OpenAIがGoogle DeepMindの不可視電子透かし技術「SynthID」を採用したと報じている。
- 来歴規格「C2PA」と組み合わせ、多層的にAI生成コンテンツの来歴証明を強化する。
- 競合であるGoogleの透かし技術を採り入れた点が注目される。
- AI生成画像の出所を識別・信頼できるようにする業界横断の取り組みとなる。
- The Decoderほか英語ソースでも同件が広く取り上げられている。
Google’s I/O announcements: new models, a cloud agent that never sleeps, and a redesigned Gemini app
Source: The Decoder | Published: 2026-05-20 02:44 JST (GoogleのI/O発表:新モデル、眠らないクラウドエージェント、刷新されたGeminiアプリ)
- GoogleがGemini 3.5 Flash、マルチモーダルのGemini Omni、常駐パーソナルエージェントGemini Sparkを一挙に発表したと報じている。
- Gemini Sparkはクラウド上で24時間常駐し「眠らない」エージェントとして位置付けられる。
- Geminiアプリのインターフェースも大幅に刷新された。
- 開発者会議の主要発表を一望できる横断的な解説記事である。
- モデル・エージェント・アプリの三位一体での更新がI/Oの柱だったことを示している。
Google検索がAIで大幅刷新、マルチモーダル入力に対応してエージェント機能も搭載
Source: GIGAZINE | Published: 2026-05-20 10:54 JST
- GoogleがI/O 2026で、検索をAIで大幅刷新しマルチモーダル入力とエージェント機能を搭載したと報じている。
- 「25年以上で最大のアップグレード」と位置付けられている。
- 画像や音声などを含む入力に対応し、検索が能動的にタスクをこなす方向へ進化する。
- 従来のキーワード検索から自然言語・対話型へのシフトを加速させる内容である。
- OpenAIなど競合のAI検索に対抗する中核施策として打ち出された。
Google pairs its Genie world model with Street View to create explorable AI worlds based on real places
Source: The Decoder | Published: 2026-05-20 20:30 JST (GoogleがGenie世界モデルとストリートビューを連携し実在地点ベースの探索可能なAI世界を生成)
- Google DeepMindが世界モデル「Genie 3」とストリートビュー画像を統合し、実在の場所から探索可能なインタラクティブAI環境を生成できるようにしたと報じている。
- ユーザーは実世界の地点を基にしたAI空間を生成・探索できる。
- Googleの広大なストリートビュー資産をAIエージェントやロボットの学習に活用する戦略である。
- 実画像由来のリアルな仮想環境を作る点が技術的な要点となる。
- 同件はGIGAZINEでもProject Genieとストリートビューの連携として取り上げられている。
Google DeepMindがマルチモーダル生成モデル「Gemini Omni」を発表、自然言語による対話と推論能力による動画生成・編集が可能に
Source: GIGAZINE | Published: 2026-05-20 11:01 JST
- Google DeepMindが、自然言語の対話と推論能力で動画生成・編集が可能なマルチモーダルモデル「Gemini Omni」を発表したと報じている。
- 対話を通じて映像を生成し、その場で編集まで行える点が特徴である。
- 推論能力を活かして指示の意図をくみ取り、映像を組み立てる。
- ITmediaの「動画版Nano Banana」報道と同一の発表を技術寄りに整理している。
- 映像制作ツールFlowなどへの統合と合わせ、生成AIの動画領域進出を示す。
ChatGPT Personal Finance入門 — Plaid連携でAI財務アドバイスを実装する
Source: Qiita | Published: 2026-05-21 01:29 JST
- OpenAIがChatGPT Proユーザー向けに、銀行・証券口座を接続して支出分析やポートフォリオ確認、財務アドバイスを受けられる個人資産管理機能をプレビュー公開したと解説している。
- Plaid連携で金融機関口座をChatGPTに接続する実装手順を扱っている。
- 支出分析・ポートフォリオ確認・財務アドバイスをAIで受け取れる構成を示す。
- まず米国のProユーザー向けのプレビューとして提供される。
- OpenAI公式ブログの「personal finance experience in ChatGPT」発表に対応する解説記事である。
Claude Codeで株の自動売買を作ったら勝率82%・2日で+10%だった
Source: Qiita | Published: 2026-05-20 22:25 JST
- 著者がClaude Codeで株の自動売買システムを構築し、勝率82%・2日で+10.0%の成績を得たと報告している。
- AIコーディングで売買ロジックを実装した個人開発の事例である。
- 短期間での運用結果を具体的な数値とともに提示している。
- Claude Codeを実務的なトレーディングツール開発に応用した記録となっている。
- 成果は短期間の実測値であり、再現性や投資リスクには注意が必要である。
All Articles
Zenn
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | 「3社AIが並列で設計書を審査する」仕組みを作るまでの試行錯誤 | 1社のAIが生成と評価を兼ねると採点が甘くなる自己評価バイアスを避けるため、3社のAIに設計書を並列審査させる構成に至った経緯を解説している。 | ArchitectAI | 22:33 |
| 2 | Laravel + Anthropic API + QuickChartで、DBデータからSEO記事を全自動生成するPHPスクリプトを書いた | Claude APIとQuickChartを組み合わせ、DBクエリから3〜4時間かかっていたSEO記事執筆を単一スクリプトで全自動化したと報告している。 | MotoHub | 20:47 |
| 3 | toC プラットフォームの AIチャット を支える技術 | toC向けCSチャットボットを実装し、カバー率97.9%・有人問い合わせ約67.7%削減を達成したと報告している。 | かわそん | 20:44 |
| 4 | Claude Code のハーネスをチームでGit管理する | 個人設定を壊さずにエージェント・スキル・フックをチーム配布できる「share-harness」リポジトリを公開したと紹介している。 | ミモ フォワードCTO・CPO | 19:08 |
| 5 | 思考拡張は、設計できる。 ~AIと話していたら、脳の使い方が変わってきた話~ | ChatGPTやClaude等との対話が思考を拡張し、予期せぬ認知的結合を生み出す体験を整理している。 | tamasub | 22:34 |
| 6 | Kiro + Hermes + OllamaでローカルAI自動モデル切り替え環境を作った | Kiro・Hermes・Ollamaを組み合わせ、会話は軽量・コード修正は専用・設計は推論モデルへ自動振り分けするローカルAI環境を構築したと解説している。 | guardianlab | 22:12 |
| 7 | GPT-5.5 で「ステップ・バイ・ステップで考えて」が効かなくなる場面?OpenAI 公式の新プロンプト構造を実例で読み解く | GPT-5.5では従来の過剰な手順指定が逆効果になり得るとして、OpenAI公式の新プロンプト構造を実例で読み解いている。 | zenchaine | 18:03 |
| 8 | 「速いか、賢いか」を選ばなくていい日が来た——Gemini 3.5 Flash | Gemini 3.5 Flashが速度と知能のトレードオフを崩したとして、モデル選定の前提が変わりつつあると論じている。 | 浅井めぐみ | 17:02 |
| 9 | Gemini 3.5 FlashをAgent開発で使うべきケースと使うべきでないケース | ベンチマークを分析し、Gemini 3.5 Flashをエージェント開発で使うべき場面と3.1 Pro等を選ぶべき場面を切り分けている。 | EVOLINK | 19:55 |
| 10 | Gemini 3.5 Flash は 3.1 Pro のコーディング性能を超えたのか?Rustコードで本気検証してみた | 実際のRust開発でGemini 3.5 Flashと3.1 Proのコーディング性能を比較検証したと報告している。 | hiyoyo | 11:07 |
| 11 | Claude Code設定ファイルを整理したら「形」は19%しかなかった——4層×2軸で見えた、整理から始まる設計の問い | 約299個のClaude Code設定ファイルを4層×2軸で整理した結果、再利用可能な「形」は19%にとどまり81%が組織固有だったと分析している。 | saitoko | 21:26 |
| 12 | Mac mini M4 Pro / M4 Max でローカル LLM を動かす:VRAM 早見表と GGUF 量子化の選び方 | Mac M系列でローカルLLMを動かす際のVRAM早見表とGGUF量子化の選び方を、統合メモリの誤解を正しつつ実用的に整理している。 | RunLocal | 21:01 |
| 13 | 急変するAIコードレビューツール市場:2026年版比較と選び方 | 価格やサービス形態の変動で半年前の情報が陳腐化するとして、2026年5月時点のAIコードレビューツールを比較し選び方を示している。 | 安並 大智 | 21:17 |
| 14 | コミット 421 件が LoRA 学習データになるまで — TiDB/ChromaDB/Pinecone で実測した AI データ基盤 | コミット421件をLoRA学習データ化する過程で、TiDB・ChromaDB・Pineconeのベクトルデータ基盤を実測比較したと報告している。 | hakaru | 18:48 |
| 15 | LLMの安全設計を無効化する、三音節構文(全LLMの構造的欠陥) | 全角句読点を含む三音節構文がDeepSeek等のフィルタを回避し得るとして、LLMの構造的欠陥として技術的に分析している。 | 鈴木 雅斗 | 20:03 |
| 16 | Claude MCPでフォーム回答をAIワークフローの起点にする | Claude MCPをフォーム作成だけでなく、回答処理を自動ワークフローの起点とする使い方を実演している。 | Lovanaut | 15:29 |
| 17 | Claude API の Tool Use を触って理解する — ミニエージェントを作りながら学ぶ | ClaudeのTool Use機能をミニエージェント構築を通じて解説し、ツール定義とエージェントループの仕組みを学べるようにしている。 | 伊佐眞皇 | 15:02 |
| 18 | AI 任せで詰まったら MCP で PRD やバグレポートを取って人間が引き取る、という escape hatch の設計 | 本番AIエージェントが詰まった際にMCPでPRDやバグレポートを取得し人間へ引き継ぐ、フォールバック機構の設計を解説している。 | zoetaka38 | 16:32 |
| 19 | Claude Code のサブエージェント構成は、業務形態で大きく変わる | 同じツールでも職務によってサブエージェント構成が変わるとして、業務形態が構成選択を左右すると論じている。 | いけ | 16:09 |
| 20 | Task・Agent Team・メインスレッド — 3問で判断するClaude Code Agentの使い分け | Task・Agent Team・メインスレッドのどれを使うかを3つの問いで判断する枠組みを提示し、不適切な構成による非効率を解消しようとしている。 | playpark | 15:21 |
| 21 | コードレビューを6段階にしたら、AIと人間の分業が見えた | CodeRabbitやCopilotが見逃した本番バグ3件を契機に、コードレビューを6段階に再設計しAIと人間の責任分界を明確化したと報告している。 | 井本 賢 | 17:27 |
| 22 | 生成AIに仕様をどう読ませるか — 入力設計の話 | QAエンジニアの視点から、生成AIに技術仕様を正確に解釈させるための入力(プロンプト)設計の勘所を解説している。 | りょうさん | 19:46 |
| 23 | Continue.dev + Ollamaでローカルコーディングアシスタントを作ってみた話 | Continue.devとOllamaでローカルコーディングアシスタントを構築し、クラウド送信やサブスク費用なしでコード作業できる環境を作ったと紹介している。 | satoru_o | 22:38 |
| 24 | AI Daily Digest: 2026/5/20 — Agentic Workflows、コーディングエージェント、エンベデッドAI | 初の統合型エンベデッドAI基盤モデル「Pelican-Unified 1.0」やエージェントワークフロー、コーディングエージェントの動向を日次でまとめている。 | KD Agentic | 22:01 |
| 25 | スタックチャン開発に必要な情報まとめ | M5StackChanハードと対応ソフトを中心に、スタックチャンロボット開発に必要な情報源を網羅的にまとめている。 | からあげ | 21:24 |
| 26 | 複数AI時代の文脈分断を解消する「独立したMemory Layer」というアーキテクチャ | 複数AIツール併用で生じる文脈分断を、ツールから独立したMemory Layerで統合するアーキテクチャを提案している。 | Memorylake AI | 17:42 |
| 27 | コミット前に AI がコードを見てくれる — IntelliJ IDEA の Self-Review with AI を試した | IntelliJ IDEAのコミット前AIレビュー機能を実際に試し、自動コード品質チェックの実用性を評価している。 | ねばねば | 17:03 |
| 28 | 思考拡張の設計理論(Draft)——違和感・体験・制約の三つの軸 | 違和感・体験・制約の3軸でAIによる思考拡張を設計する理論的枠組みを下書きとして提示している。 | tamasub | 19:49 |
| 29 | ボイスジャーナリングでデバックとチューニング Notebook LM | 音声メモとNotebookLMを組み合わせ、デバッグや自己分析に活用する実験的ワークフローを記録している。 | P3 | 19:07 |
| 30 | AI共創:3.5Flash版による系統A(プロンプトエンジニアリング)と系統B(プロトコルエンジニアリング)の更なる断絶の予感 | Gemini 3.5 Flashを用い、プロンプトエンジニアリングとプロトコルエンジニアリングの分岐が一層深まる可能性を考察している。 | 田 栄人 | 21:14 |
| 31 | 情報安全確保支援士・セキスペのAI勉強法 | NotebookLM・Gemini・ChatGPTを使い分け、情報処理安全確保支援士試験の学習効果を高めるAI活用法を解説している。 | たきびラボ | 18:00 |
| 32 | Ollama の新バージョン (v0.30-rc) が良さげ、全モデル高速化した話 | Ollama v0.30-rcがllama.cpp統合とメモリ管理改善で全モデルを高速化したとして、その効果を報告している。 | mtk | 16:55 |
| 33 | Amazon Quick Desktop をインストールして SPReAD 研究計画調書作成支援 Skill を起動する | Amazon Quick DesktopのSkills機能を導入し、研究計画調書作成支援を例に専門タスクへの適用手順を示している。 | Yohei Katayama | 16:48 |
| 34 | コーディングエージェントが雑になる4箇所に、skill でゲートを置いた話 | コーディングエージェントが手を抜きがちな4箇所に、skillでチェックゲートを置くツール「Quaere」を導入したと解説している。 | Haru | 14:48 |
| 35 | GitHubCopilot(VSCode/CLI)でローカルLLMを使う | BYOK機能とOllamaを使い、OpenAI API互換を前提にGitHub CopilotでローカルLLMを動かす手順を解説している。 | arika | 13:18 |
| 36 | Gemini 3.5 Flashで変わるのは「AIの賢さ」より、開発の待ち時間かもしれない | Gemini 3.5 Flashの主因は知能向上よりも開発の反復待ち時間の短縮にあるかもしれないと論じている。 | 剛 | 13:51 |
| 37 | プログラミング未経験の僕が、AIと一緒に10日で動く仮想通貨自動売買botを作った話【無料版】 | プログラミング未経験の著者がGeminiとClaudeを使い、10日で動く仮想通貨自動売買botを作った過程を記録している。 | マッチ | 12:42 |
| 38 | スタックチャンとAmuletの長期記憶設計(Layer1〜3) | 複数回の対話をまたいでAIが長期記憶と文脈理解を獲得するための、Layer1〜3の設計アプローチを解説している。 | ai_zawa | 20:53 |
| 39 | 【Vertex AI】実践・かんたんRAG構築 | Google Vertex AIのマネージドサービスを使い、法務文書を例にRAGシステムを構築する実践手順を解説している。 | マシンラーニング・ソリューションズ | 18:25 |
| 40 | Google ColabだけでRAGを試す: TiDB Cloud Zero と pytidb / LlamaIndex | TiDB Cloud Zeroとpytidb・LlamaIndexを使い、Google Colab環境内だけでRAGを構築・実行する手順を示している。 | bohnen | 11:17 |
| 41 | AIコーディングエージェントの能力を拡張する「Agent Plugins for AWS」を試してみた | AWSのオープンソースツール「Agent Plugins for AWS」を試し、インフラ構築タスクでAIコーディングエージェントの能力を拡張できるか検証している。 | kameoncloud | 14:31 |
| 42 | Agent開発の思考を「演算」で整理する — A+B=C から始める設計言語 | 数式の比喩でエージェント設計の判断を整理し、スコープの明確化とスコープクリープ防止を狙う設計言語を提案している。 | コロネ | 11:25 |
| 43 | GitHub CopilotのOTELテレメトリをPendo Agent Analyticsで可視化してみた | GitHub CopilotのOTELテレメトリをPendo Agent Analyticsで可視化し、利用パターンや会話文脈を分析できるようにしたと報告している。 | bandaid | 09:59 |
| 44 | Planner / Generator / Evaluator + Playwright で個人開発 PWA を1日でまるっと回した話 | Planner-Generator-EvaluatorフレームワークとPlaywrightテストで、PWAの2機能を1日で実装しアクセシビリティ評価を改善したと報告している。 | はにゃ | 15:15 |
| 45 | テストが通ると動くは別 ── うちのエージェントが CoDD を入れた訳 | 要件・設計・語彙・コード・テスト・実行を有向非巡回グラフで結ぶCoherence-Driven Developmentを導入した理由を説明している。 | いち | 14:34 |
| 46 | 職種を超えて成果を出すAIネイティブな開発プロセス | 非技術職のビジネスメンバーがAIエージェントとGitHubで開発に参加できる、BizReachのAI Product Studioの取り組みを記録している。 | ozwts | 13:10 |
| 47 | Claude Code 実践ワークフロー設計 | Planモード・TodoWrite・スラッシュコマンド・Skills・サブエージェント・Hooks・スケジュール実行を組み合わせ、コスト最適化した自己管理型開発ワークフローを設計している。 | Sin9_Ha | 12:13 |
| 48 | Playwright × Rails × Claude Code で実現する爆速E2Eテスト開発 | PlaywrightとRails、Claude Codeを組み合わせ、E2Eテストの作成と実装を高速化するワークフローを実演している。 | yamitake@yapr | 11:14 |
| 49 | 二人の私が同じDMを読んだ朝 — 重複起動の事故を整理で消さずに2段fallbackに変えた17分 | AIエージェントが同一タスクを並行実行する重複起動事故を、整理ではなく2段フォールバック機構へ作り替えた経緯を記録している。 | いち | 09:31 |
| 50 | AI文章自然化ツールを試してみた | AI生成っぽい文章を滑らかにする自然化ツールを評価し、下書き後の仕上げ補助として最も有用だったと結論付けている。 | raikazenoshin | 16:04 |
| 51 | 開発チームリーダーのAI活用パターン3つ | アジャイルチームのスプリント運営やチケット管理を担う開発リーダー向けに、実践的なAI活用パターンを3つ示している。 | y-negishi | 09:00 |
| 52 | 自分の wiki、Obsidian なしで開ける? 記憶が勝手に賢くなる? — KIOKU v0.10 | Claude Code・Desktop等向けのOSS記憶システムKIOKU v0.10を紹介し、可視化や自己診断機能を備えたと解説している。 | Ryu. @MEGAPHONE | 12:32 |
| 53 | ClaudeでMicrosoft 365を使う3つの入口を、35個の権限要求を見てから選び直した話 | ClaudeとMicrosoft 365を連携する3つの入口を、要求される35個の権限を確認した上で最適な接続方式に選び直した経緯を解説している。 | 高田祥 | 09:00 |
| 54 | 無料GPUでAI論文を自動復元する——FeynmanとColab-MCPで研究パイプラインを構築した | 研究エージェントFeynmanとcolab-mcpを組み合わせ、無料GPUで論文の追試を自動化する研究パイプラインを構築したと報告している。 | Bayar | 11:09 |
Qiita
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | Web版ChatGPTのSkillでExcelフォーマットを守らせるまでにやったこと | 複数サイトを比較してExcel評価レポートを一定フォーマットで出力させるため、ChatGPTのSkillで書式の一貫性を保たせた工程を記録している。 | taroh_7 | 23:54 |
| 2 | Gemini 3.5 Flash は本当にダメなのか?英単語の覚え方ヒント生成ベンチしてみた | 英単語の覚え方ヒント生成でGemini 3.5 Flashをベンチマークし、前世代比で性能劣化したとの主張を検証している。 | ynishi2014 | 22:44 |
| 3 | RTX 4070でローカルLLMにコードを書かせる2026年版 — Qwen3 Coderとgpt-oss:20bを実測 | クラウドAIが制限される環境向けに、RTX 4070でQwen3 Coderとgpt-oss:20bを実測し、ローカルLLMでのコード生成の実用度を評価している。 | kenimo49 | 22:30 |
| 4 | AIの「探索空間」を外部から変更する——思考支援プロトコルKISの設計思想と実験結果 | 出力内容に着目する従来のプロンプト工学を超え、AIが探索する空間自体を外部から変更する思考支援プロトコルKISの設計思想と実験結果を提示している。 | kis-project | 22:15 |
| 5 | 【備忘録】Genkit Middlewareを公式情報から確認する ― AIエージェントに挟める制御ポイントの整理 | 5月14日発表のGenkit Middlewareを公式情報から確認し、AIエージェントに挟める制御ポイントを整理している。 | Tadataka_Takahashi | 23:37 |
| 6 | なぜ「久しぶりに使うGeminiは使えない」と錯覚するのか?――『ゼロコンテキスト・アンチパターン』というユーザー側の論理欠陥 | Geminiが使えないという錯覚の原因を、AIの劣化ではなくユーザー側の「ゼロコンテキスト・アンチパターン」という論理的欠陥にあると分析している。 | 618kazeman | 23:34 |
| 7 | OpenAIの音声エージェント gpt-realtime-2 | OpenAIの音声エージェントgpt-realtime-2を、AIと音声で会話できるシステムとして基本から解説している。 | atm_sakura | 20:49 |
| 8 | Claude CodeからCodexを利用するための初期設定 | Codex CLI 0.131.0・Claude Code 2.1.144・Windows 11で検証した、Claude CodeからCodexを利用するための初期設定手順を解説している。 | omi_last_stand | 17:54 |
| 9 | イーロン・マスク、サム・アルトマンとOpenAIに対する訴訟で敗訴 | OpenAIの事業方針をめぐるマスクの訴訟が敗訴に終わった経緯を分析している。 | quotidia | 07:20 |
| 10 | RTX2080Ti(22GB)で+LM Studio+Qwen3.6-27Bのトークン速度UP | RTX2080Ti上でQwen3.6-27Bを動かす際、ツールや設定を変えてトークン生成速度を比較し改善した結果を報告している。 | Qapla | 21:13 |
| 11 | 【注意】最新の Gemini 3.5 Flash は「Pro より高コスト」になる逆転現象の可能性がある話 | Gemini 3.5 FlashがProより高コストになる逆転現象が起こり得るとして、「Flash=低コスト」という前提が崩れる点を注意喚起している。 | ynarita22 | 19:47 |
| 12 | AIエージェントのメモリツール完全ガイド2026:Mem0 vs Zep vs Letta vs MemGPTを徹底比較 | ステートレスなAIエージェントの記憶欠如を補うため、Mem0・Zep・Letta・Cogneeなど2026年の長期記憶ツールを徹底比較している。 | agdexai | 16:05 |
| 13 | 住所1つで洪水リスク・避難経路・気象警報を返すRAGシステムをAWSで作った | 地域防災計画など散在する防災情報を統合し、住所を1つ入力するだけで防災データを返すRAGシステムをAWSで構築したと報告している。 | kojiman | 10:49 |
| 14 | LLMから自律型エージェントへ:RAGと外部ツール連携の仕組み | RAGと外部ツール連携が学習データの限界を超えてLLMを拡張する仕組みを、自律型エージェントへの移行として解説している。 | jjking | 07:48 |
| 15 | 世界の電力・再エネAPI/MCP/AIエージェント事例42選:エネルギー事業は「APIで売る」時代に入った | 電力・再エネのAPI・MCP・AIエージェント事例を42件挙げ、エネルギー事業がアプリではなくAPI起点で成立する時代に入ったと論じている。 | satoru_higuchi | 22:31 |
ITmedia AI+
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | アクセンチュアらが「エージェント型工場」を開発 製造現場の計画外停止の削減図る | アクセンチュア・Avanade・Microsoftが製造業向けAIエージェント基盤を共同開発し、従来の分析ダッシュボードを超えて現場の意思決定を支援すると報じている。 | 08:00 |
| 2 | NHNテコラス、AIエージェント導入から運用改善まで支援する新サービスを提供 | NHNテコラスが、Amazon Bedrock AgentCoreと統合パッケージを活用し、AIエージェントの導入から運用改善までを支援する新サービスを提供すると報じている。 | 07:00 |
| 3 | 【やさしいデータ分析】ベイズ統計入門 ~ 古典的な統計との違いと使い分け | 連載第5回として、ベイズ統計の基礎概念と古典統計との違い・使い分けを実務的なデータ分析向けに解説している。 | 05:00 |
GIGAZINE
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | Googleが複数サービスや店舗を横断して使えるショッピングハブ「Universal Cart」発表、UCP対応でAIエージェントが人間の代わりにオンラインショッピングを完結可能に | GoogleがSearch・Gemini・YouTube・Gmailを横断する「Universal Cart」を発表し、UCP対応でAIエージェントが人間に代わって購入を完結できるようにしたと報じている。 | 19:35 |
| 2 | Gemini 3.5 Flashの総パラメータ数は2500億~3000億か、Hacker NewsユーザーがTPU性能から逆算 | Hacker NewsユーザーがTPU性能から逆算し、Gemini 3.5 Flashの総パラメータ数を2500億〜3000億と推定したと報じている。 | 19:00 |
| 3 | GoogleのウェブベースのAI StudioでユーザーがネイティブAndroidアプリを作成できるように | Google AI Studioが自然言語プロンプトからネイティブAndroidアプリを生成できるようになり、Workspace連携にも対応したと報じている。 | 18:25 |
| 4 | Googleが映画制作ツール「Flow」と音楽制作ツール「Flow Music」を大幅アップデート、Gemini Omni提供&AIエージェント追加&カスタムツール作成機能&モバイルアプリも新登場 | GoogleがFlowとFlow MusicにGemini Omni提供・AIエージェント・カスタムツール作成・モバイルアプリを加える大型アップデートを発表したと報じている。 | 17:10 |
| 5 | Microsoftがマルウェアを「正規ソフト」に見せかける証明書1000件超を失効 | Microsoftが攻撃者「Fox Tempest」がマルウェアを正規ソフトに偽装するために使った1000件超のコード署名証明書を失効させたと報じている。 | 15:45 |
| 6 | YouTubeに対話型検索機能「Ask YouTube」が登場、さらにマルチモーダル生成AI「Gemini Omni」がYouTubeショートのリミックスとYouTube Createアプリに導入へ | YouTubeに対話型検索「Ask YouTube」が登場し、Gemini OmniがYouTubeショートのリミックスやYouTube Createに導入されると報じている。 | 15:30 |
| 7 | Googleが科学者のAI利用に役立つ実験機能コレクションの「Gemini for Science」を発表、30以上の主要な生命科学DBとツールの知見を統合したAIエージェントスキル集「Science Skills」やAIツール「ERA」なども登場 | Googleが30以上の生命科学DBを統合した「Gemini for Science」と、AIエージェントスキル集「Science Skills」やツール「ERA」を発表したと報じている。 | 15:29 |
| 8 | GoogleストリートビューとGoogleのインタラクティブな世界構築ツール「Project Genie」が連携し実世界の画像をもとにしたリアルな世界を生成可能に | Project Genieがストリートビュー画像と連携し、実在地点の画像を基にしたインタラクティブな世界を生成できるようになったと報じている。 | 15:22 |
| 9 | Androidデバイス間でタスクを移動できる新機能「Continue On」 | Androidの新機能「Continue On」が、デバイス間でタスクをシームレスに引き継げるようにすると報じている。 | 13:48 |
| 10 | GoogleがGemini APIに「マネージドエージェント」を追加、AIエージェントの実行環境を丸ごと提供へ | GoogleがGemini APIに「マネージドエージェント」を追加し、AIエージェントの実行環境を丸ごと提供すると報じている。 | 12:48 |
| 11 | GoogleがAIエージェント「Gemini Spark」発表、Google Cloud上の仮想マシンを使用して24時間365日バックグラウンドで動作 | GoogleがGoogle Cloud上の仮想マシンで24時間常駐動作する個人向けAIエージェント「Gemini Spark」を発表したと報じている。 | 12:28 |
| 12 | GoogleがAndroid XR対応でGemini搭載のスマートグラスを公開、2026年秋にリリース予定 | GoogleがAndroid XR対応・Gemini搭載のスマートグラスを公開し、2026年秋にリリース予定だと報じている。 | 12:11 |
| 13 | Appleが新たなアクセシビリティ機能とApple Intelligenceを活用したアップデートを発表 | AppleがApple Intelligenceを活用し、VoiceOverや拡大表示・音声操作などにわたるアクセシビリティ強化を発表したと報じている。 | 11:59 |
| 14 | Googleが処理しているトークン量は月間3200兆、1年間で7倍に増大 | Googleの月間処理トークン量が3200兆に達し、1年間で7倍に増大したと報じている。 | 11:48 |
| 15 | GoogleのAI透かし技術「SynthID」がOpenAIに採用される | OpenAIがAI生成コンテンツ識別のため、GoogleのAI透かし技術「SynthID」を採用したと報じている。 | 11:25 |
| 16 | Googleが「Gemini 3.5」シリーズを発表、まずは軽量版の「Gemini 3.5 Flash」から | GoogleがGemini 3.5シリーズを発表し、まず軽量版のGemini 3.5 Flashから提供すると報じている。 | 10:31 |
| 17 | シミュレーション世界で複数人が相互作用できるマルチエージェント世界モデル「Agora-1」が登場 | Odysseyが、物理ベースの予測でシミュレーション環境内で複数エージェントが相互作用できる世界モデル「Agora-1」を公開したと報じている。 | 08:00 |
| 18 | 「AIデリバリーシステムの導入で160億円超の損害を被った」とピザハットのフランチャイズ加盟店が提訴 | ピザハットのフランチャイズ加盟店が、AIデリバリーシステムの導入で1.6億ドル超の損害を被ったとして提訴したと報じている。 | 20:00 |
Publickey
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | Google Antigravity、Androidアプリ開発に正式対応。AIエージェントのための「Android Knowledge Base」「Android Skills」も公開 | GoogleがAntigravityをAndroidアプリ開発に正式対応させ、AIエージェント向けの「Android Knowledge Base」「Android Skills」を公開したと報じている。 | 12:16 |
OpenAI Blog
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | The next phase of OpenAI’s Education for Countries(OpenAIの「Education for Countries」の次フェーズ) | OpenAIが教育向け取り組み「Education for Countries」を前進させ、新たな提携・教員研修・ツールで学校へのAI導入を拡大すると発表している。 | 00:00 |
Google AI Blog
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | I/O 2026: Welcome to the agentic Gemini era(I/O 2026:エージェント的Geminiの時代へようこそ) | スンダー・ピチャイがI/O 2026で、Geminiによって作業をより多くこなせるようにするとして、エージェント的AI時代の到来を打ち出している。 | 02:45 |
| 2 | A new era for AI Search(AI検索の新時代) | Googleが検索エンジンの強みとAIの強みを融合させる次の一歩を示し、AI検索の新時代を打ち出している。 | 02:45 |
| 3 | New ways to create and get things done in Google Workspace(Google Workspaceで作成・作業を進める新機能) | GoogleがGmail・Docs・Keepの音声機能や新デザインツール「Google Pics」、AI Inbox更新などWorkspaceの新機能を発表している。 | 02:45 |
| 4 | Everything new in our Google AI subscriptions, fresh from I/O 2026(I/O 2026発表のGoogle AIサブスク新情報) | Googleが月額100ドルのAI Ultraプランを導入し、AI Plus・Pro・Ultra各サブスクの新機能と特典を発表している。 | 02:45 |
| 5 | How AI Mode is changing the way people search in the U.S.(AIモードが米国の検索方法をどう変えているか) | 投入から1年が経ち、AIモードのユーザーがキーワード検索から自然言語クエリへ移行していると報告している。 | 02:45 |
Simon Willison
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | Google I/O, Gemini Spark, Antigravity(Google I/O、Gemini Spark、Antigravity) | Google I/Oの発表を分析し、Gemini Sparkエージェントと、企業導入におけるプロンプトインジェクションのセキュリティ懸念に焦点を当てている。 | 00:32 |
| 2 | How fast is 10 tokens per second really?(毎秒10トークンは実際どれくらい速いのか?) | 毎秒5〜800トークンの出力速度をシミュレーションするHTMLアプリを公開し、宣伝されるモデル速度の体感を掴めるようにしている。 | 02:57 |
The Decoder
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | LinkedIn’s war on AI slop is not just a policy update—it is an admission that the platform lost control of its feed(LinkedInのAIスロップ対策は方針更新にとどまらず、フィード制御を失った自認である) | LinkedInがAI生成の低品質投稿対策を進め初期試験で94%の識別精度を達成した一方、親会社Microsoftはプラットフォーム上でAI統合を推進しており矛盾していると論じている。 | 18:21 |
| 2 | Google tests the app market version of the SaaSpocalypse(Googleがアプリ市場版の「SaaSの黙示録」を試す) | Google AI StudioがテキストからネイティブAndroidアプリを生成できるようになり、単純なユーティリティではPlay Storeの存在意義が薄れる可能性があると論じている。 | 15:27 |