AI News Digest: 2026-06-04
Top 20
日本政府、AI「Mythos」アクセス権を取得
Source: ITmedia AI+ | Published: 2026-06-04 10:27 JST
- Anthropicが日本政府サイバーセキュリティ部門とメガバンク3行(MUFG・みずほ・三井住友)にClaude Mythos Previewへのアクセス権を6月3日付で付与したと判明した。
- 提供はサイバー防衛を主目的とした「Project YATA-Shield」を通じて行われ、AI駆動の脅威対策と重要インフラ保護を狙う。
- 並行して「Project Glasswing」のもと15社以上の企業とセキュリティ連携を結ぶ枠組みも構築する。
- 当局は「努力ではなく実際の前進」と位置付け、Google・Microsoft・OpenAIなど他社AIに対抗する戦略的措置と説明した。
- Anthropicは日本のAI企業・研究機関とも連携し、Mythos周辺のエコシステム形成を進める方針を示した。
Claude Opus 4.8は忖度しません
Source: ITmedia AI+ | Published: 2026-06-04 05:00 JST
- Anthropicが5月28日にリリースしたClaude Opus 4.8は、忖度(sycophancy)スコアが4.7の1.33から1.15へ大幅改善し、ユーザー迎合を抑える方向に調整された。
- SWE-Bench Proで69.2%とGPT-5.5の58.6%を上回り、Terminal-Bench 2.1では74.6%とGPT-5.5の78.2%にわずかに劣る結果となった。
- 文脈ウィンドウは1億トークンに達し、タスク複雑度に応じて推論深度を調整する「適応的思考」機能を搭載する。
- 4.7→4.8間は破壊的変更を含まず、既存実装の互換性を保ったまま動的ワークフローと努力レベル制御を追加した。
- 不確実な場合は回答を拒否し、ユーザーの押し戻しに対しても訂正を維持するなど、誠実性の挙動を強化した。
Gemma 4 12B登場
Source: ITmedia AI+ | Published: 2026-06-04 01:38 JST
- Googleが6月3日にマルチモーダルオープンモデルGemma 4 12Bを発表し、6月4日にApache 2.0ライセンスで公開した。
- 16GBメモリのノートPCで動作するよう設計されており、画像用の軽量埋め込みモジュールと音声生信号への直接射影でメモリ消費を削減している。
- GPQA Diamondで78.8%(26B版82.3%)、MMLU Proで77.2%(26B版82.6%)を記録し、前世代Gemma 3 27Bを両ベンチマークで上回った。
- Hugging FaceとKaggleで配布され、LM Studio・Ollama・llama.cpp・vLLM・Google Cloudに対応する。
- 画像と音声の両方をテキストと同時に処理できる構成のまま、推論レイテンシとフットプリントの双方を抑えている点が特徴と整理されている。
Windsurf、Devin Desktopにリニューアル
Source: ITmedia AI+ | Published: 2026-06-04 05:27 JST
- Cognitionが2025年7月に買収したAIコードエディタWindsurfを「Devin Desktop」へ改名し、複数エージェントをかんばん形式で同時管理する統合IDEとして再設計した。
- 統合対象はCognition自社のDevinに加え、OpenAI Codex、AnthropicのClaude Agent、企業独自エージェントで、オープン規格「Agent Client Protocol」を採用する。
- 新機能「Spaces」によりエージェント同士がセッション・ファイル・コンテキストを共有可能になった。
- 既存Windsurfユーザーには通常アップデートとして配信され、プラン・価格・VS Codeとの後方互換性は維持される。
- ローカルとクラウドのいずれの環境でもタスク実行が可能な単一ワークスペースとして提供される。
オートデスク、AIアシスタント機能を展開
Source: ITmedia AI+ | Published: 2026-06-04 09:00 JST
- AutodeskがFusion 360・Inventor・Moldflow・Vaultを横断する「Autodesk Assistant」をテックプレビュー公開し、設計データのコンテキスト連携を実装した。
- Fusion 360向けには「Prompt-to-API」を搭載し、テキスト指示でモデリングタスクを直接実行可能にした。
- 「Autodesk Fusion MCP」と「Autodesk Fusion Data MCP」の2種類のMCPサーバを開発し、設計データへのAIアクセスを構造化する。
- Anthropicとの提携でClaudeをクリエイティブ設計に組み込み、自然言語からデザイン生成・修正を行うフローを提供する。
- InventorではコードレスでのタスクオートメーションとAI支援ワークフロー、Moldflowではシミュレーション結果の最適化をそれぞれ統合する。
ServiceNowとAccenture、エージェント型AI全社展開
Source: ITmedia AI+ | Published: 2026-06-04 08:00 JST
- ServiceNowとAccentureが6月にエージェント型AIの企業全社展開を支援する共同プログラム「Forward Deployed Engineering(FDE)」を開始したと発表した。
- AccentureのPulse of Change報告では32%の企業がエージェント型AIの大規模実装に課題を感じており、技術力ではなくガバナンス整備が本質的なボトルネックだと位置付けた。
- 300以上の事前構築AIコンポーネントとServiceNowの「AI Control Tower」を組み合わせ、ビジネス成果に対するエージェントの性能を継続監視する。
- Accentureが業務知見、ServiceNowがプラットフォーム基盤を担う分担で、PoC止まりからの脱却を狙う設計とした。
- 「責任あるAI開発と本番ガバナンス」を最初から組み込んだ実装手法を提供する点を強みに据えている。
Google Chromeの新機能「Skills」
Source: ITmedia AI+ | Published: 2026-06-04 13:00 JST
- Googleが4月発表のChrome内「Skills」機能を6月にパブリックテストへ拡大し、Geminiで作成したプロンプトをワンクリック再利用できる仕組みを
chrome://skills/browseで提供開始したと整理している。 - 保存したSkillはドロップダウンや「+」ボタンから呼び出し可能で、Chromeにログインした全デスクトップ端末で共有される。
- 個別フィットネスプラン作成・製品比較・重要メール作成・送料分析など、繰り返し発生するAIタスクをテンプレ化する用途を想定している。
- 安全策としてGemini同等のコンテンツフィルタと「self-sanitization」保護を組み込む。
- 既存Skillの編集や新規作成を許容し、ユーザー固有のワークフローへの適合を前提とした設計を採用している。
アドバンテック、エッジAI開発期間を86%削減
Source: ITmedia AI+ | Published: 2026-06-04 07:30 JST
- アドバンテックがCOMPUTEX TAIPEI 2026で「WEDA(WISE-Edge Developer Architecture)」を発表し、エッジAIモデルの開発・展開・運用期間を最大86%削減できると説明した。
- NVIDIA NemoClawをAIエージェントフレームワークとして採用し、VLMとLLMを統合した3Dカメラデータのリアルタイム処理を実装する。
- AIサーバーAIR-420はNVIDIA RTX PRO 6000 Blackwellを、エッジ機AIR-075はNVIDIA Jetson Thor(2070 TFLOPS)を搭載する。
- クラウドでのモデル開発とエッジでの展開を同一アーキテクチャで行えるティアード構成を採用する。
- センサー統合とAIモデル運用をプラットフォーム依存なしに扱えるオープン性を訴求している。
OpenAI Proposes AI Regulation(OpenAIがフロンティアAI規制案を提示)
Source: GIGAZINE | Published: 2026-06-04 15:40 JST
- OpenAIが6月4日付で発表した「Frontier Safety Blueprint」は、最先端AIモデルに対する連邦規制の3本柱として「全国安全評価制度」「専門家評価インフラ(CAISI)」「政府全体の防衛戦略」を提案した。
- 公開前のリスク評価・独立監査・インシデント報告・未公開モデル重みの保護・内部告発者保護を盛り込んでいる。
- 連邦機関がAIリリースを統制する「ゲートキーパー」化には反対し、企業に最終責任を残したまま透明性レポートと評価結果のみ公開する形を提唱した。
- 州ごとに異なる規制ではなく連邦レベルの調整を求めており、「AIリスクは州・国境を越える」と主張する。
- フロンティアAIが経済・研究・国家安全保障に大きな影響を及ぼす前の初期統治が必要との立場を明示している。
Google’s Gemma 4 12B Model(Googleが軽量Gemma 4 12Bを公開)
Source: GIGAZINE | Published: 2026-06-04 17:53 JST
- GoogleがエンコーダーフリーアーキテクチャのGemma 4 12Bを公開し、16GBメモリのノートPC上で画像と音声をテキストと同時処理できる軽量マルチモーダルモデルだと報じている。
- 画像は軽量埋め込みモジュール、音声は生信号を直接射影する設計でレイテンシとメモリ消費を抑えている。
- GPQA Diamondで78.8%、MMLU Proで77.2%を達成し、より大型の26B版に肉薄するスコアを記録した。
- ライセンスはApache 2.0で、Hugging FaceとKaggleからダウンロード可能とした。
- LM Studio・Ollama・llama.cpp・vLLM・Google Cloudなど主要ローカル実行環境への対応が示されている。
Ideogram 4.0 Image Generation(Ideogram 4.0、画像生成モデルをオープンウェイトで公開)
Source: GIGAZINE | Published: 2026-06-04 11:49 JST
- Ideogram社が93億パラメータのIdeogram 4.0をオープンソースとして6月3日に公開し、ローカル実行可能な画像生成モデルとして提供を開始した。
- DesignArenaの匿名評価でグローバル4位にランクし、Googleの「Nano Banana Pro」を上回り、オープンソースモデルではトップに位置付けられた。
- 長文テキストの精密描画・バウンディングボックスによる空間レイアウト指示・日本語プロンプト対応を強みとする。
- 商用利用には別途ライセンスが必要で、FP8とNF4の量子化版(24GB VRAM向け)が配布される。
- ComfyUIがネイティブ対応し、Hugging Faceで無料デモも提供される。
Google Dreambeans App(Google、日替わりパーソナライズドストーリーアプリDreambeansを公開)
Source: GIGAZINE | Published: 2026-06-04 11:20 JST
- Googleが実験的アプリ「Dreambeans」を公開し、Gmail・カレンダー・Photos・YouTube視聴履歴・検索履歴を統合して日替わりのパーソナライズドストーリーを生成すると報じている。
- 米国のAndroid/iOSユーザーで18歳以上のGoogle AI Ultra加入者に限定提供する。
- AI生成イラストを添えた限定数のストーリーを提示する設計で、無限スクロールを避けた情報キュレーション型UXを採る。
- 例として「ペット用品の配送通知」と「友人の訪問予定」から犬の訓練ヒントやペット同伴可レストランを横断的に提案するユースケースを挙げている。
- フィードバック機能やお気に入り保存に対応し、Googleはパフォーマンス検証後に言語・地域拡張を行う段階的展開方針を示した。
Hermes Desktop Agent(HermesがデスクトップAIエージェントGUIをパブリックプレビュー公開)
Source: GIGAZINE | Published: 2026-06-04 13:14 JST
- Hermesが「Hermes Desktop」を6月3日にパブリックプレビュー公開し、AIエージェントをローカル管理するWindows・macOS・Linux対応のGUIアプリを提供開始したと整理している。
- チャットUI・進捗監視・Skills/Artifacts管理・画像インライン表示・組み込みターミナル・Hermes Web Dashboardによる管理パネルを備える。
- 「高性能メモリーシステム」を中核に、ユーザー入力や運用手順を記憶し、複雑なタスクの実行ステップをアーティファクトとして再利用可能にする。
- 任意のAIモデルを選んで常駐プロセスとしてファイル読み込みとタスク自律実行を行う構成で、永続性と適応性を訴求している。
- 「使い続けるほど成長するエージェント」とのコンセプトを掲げ、メモリ駆動の継続改善を中心機能に据えている。
Google Gemma 4 12B Free Release(Google、Gemma 4 12Bを無料で公開)
Source: GIGAZINE | Published: 2026-06-04 10:36 JST
- Googleが高性能オープンAIモデルGemma 4 12Bを無料で公開し、16GB VRAMで一般的なノートPCでも動作する点が強調されている。
- マルチモーダル対応でテキスト・画像・音声を同時処理し、過去のGemma 3 27Bを上回るベンチマーク結果を示している。
- ライセンスはApache 2.0で、企業・個人ともに商用利用が認められる。
- 軽量埋め込みモジュールと音声直接射影アーキテクチャによってメモリ消費を抑え、ローカル実行を現実的にしている。
- Hugging Face・Kaggle経由で配布され、LM Studioをはじめ既存のローカル推論環境にすぐ組み込めることを示している。
xAI updates Grok Imagine to 1.5 with image-to-video generation at 720p resolution(xAI、Grok Imagine 1.5で画像→動画生成を720p対応)
Source: The Decoder | Published: 2026-06-04 17:04 JST
- xAIが新モデル「Grok Imagine Video 1.5」をプレビュー公開し、1枚の静止画から最大720pのショート動画を生成可能にしたと報じている。
- テキストプロンプトでカメラの動き・テンポ・雰囲気を指定でき、元画像のディテールとライティングを保持する設計を採る。
- 複数ショットを連結して長尺の動画シーケンスを構成する機能(scene stitching)を搭載した。
- xAI API経由で「数行のコード」で統合可能なプレビューとして提供され、開発者の組み込みを容易にする方針を示した。
- OpenAIがリソース制約と事業性不透明を理由にSoraを撤退した直後のリリースで、Seedance・GoogleのVeoとの直接競合に踏み込んだ。
AI Outperforms Law Professors(スタンフォード研究、AIが法学教授を75%で上回る)
Source: GIGAZINE | Published: 2026-06-04 20:00 JST
- スタンフォード法学スクールのJulian Nyarko氏らが行ったブラインド評価で、AI生成回答が法学教授の回答に対して約75%の直接比較で勝ったと結論付けた。
- 対象は契約法の40問で、16人の米法学教授が作成した模範解答とAI回答を、評価者には出所を伏せて長さと構造を揃えた上で比較した。
- 誤誘導・有害な回答率は人間教授の約12%に対しAIは3.5%と低く、「複雑な内容の統合と新状況への適用」が必要な質問でも安定した。
- Nyarko氏は「AIを学生のために責任ある形で活用する方法」へ議論を移すべきと主張する。
- 法学教育のあり方そのものを問い直すリサーチエビデンスとして提示されている。
東大松尾研、Anthropic、PKSHAが協業
Source: ITmedia AI+ | Published: 2026-06-04 07:27 JST
- 東京大学松尾・岩澤研究室、Anthropic、PKSHA Technologyが「Japan AI Index」フレームワークを共同立ち上げし、AIの日本社会への影響を可視化する方針を示した。
- AnthropicからClaudeの匿名化利用統計、日本の経済・雇用・教育公開データ、PKSHAの企業導入知見を組み合わせて分析する。
- 職種別AI活用法、年齢・地域別利用率、雇用・組織への影響、教育の変容を主な観測領域に据える。
- 初の分析結果は2026年秋に公開予定で、10〜11月にダッシュボードとレポートを公開し四半期更新・年次報告で継続する。
- PKSHAは「世論の7割が不安・3割が肯定」と紹介し、雇用置換の議論を事実ベースに引き戻す動機を語った。
AI Discovers Drug Side Effects(AIが社会メディアからGLP-1薬の副作用を発見)
Source: GIGAZINE | Published: 2026-06-04 14:00 JST
- ペンシルベニア大学の研究チームが2019年5月〜2025年6月のReddit投稿41万件以上をOpenAIのGPTモデルで解析し、GLP-1受容体作動薬の未報告副作用として「月経不順」「悪寒・ほてり」を新たに同定した。
- 解析対象は自己申告で薬剤使用を述べた67,008ユーザーで、43.5%が少なくとも一つの副作用を報告した。
- 既知副作用の頻度は吐き気36.9%、疲労16.7%、嘔吐16.3%、便秘15.3%、下痢12.6%と再確認された。
- 「臨床試験が最良だが、SNS解析は緊急時に速さの優位がある」と研究者がコメントしている。
- 患者が医師に開示しづらい症状もSNSで自発的に語られるため、従来研究を補完するシグナル源になると位置付けた。
Anthropic AI Cyber Threats Report(Anthropic、AIを使ったサイバー攻撃の実態を832アカウント分析で報告)
Source: GIGAZINE | Published: 2026-06-04 11:58 JST
- Anthropicが2025年3月〜2026年3月に停止した832件の悪意あるアカウントをMITRE ATT&CKにマッピングし、AIを用いたサイバー攻撃の実態を分析した報告書を公表した。
- 67.3%(560アカウント)がマルウェア作成など準備段階でAIを利用し、6.5%(54件)はネットワーク深部侵入にAIを活用した。
- 「中リスク以上」の比率は調査期間中に33%から56%へ上昇し、アカウント発見など侵入後の活動にAI利用が8.9ポイント増加した。
- 「使用技術数と攻撃者スキルの相関は失われた」と結論し、低スキル攻撃者でも約16技法、熟練者でも約20技法と差が縮まったと示した。
- 2025年11月にAnthropicが阻止した国家支援作戦は30技法・13戦術を駆使しながら自律エージェントとして稼働しており、既存ATT&CKフレームでは可視化困難だと指摘した。
ソニー経理が「1万時間」削減
Source: ITmedia AI+ | Published: 2026-06-04 07:00 JST
- ソニーグループの経理部門が「Global Business Service Center」設立から2年間で150件超のDXプロジェクトを推進し、累計1万時間超の業務削減を達成したと報じられている。
- プロジェクト立ち上げは経理・財務領域の作業時間を抜本的に削減することを目標としている。
- 個別プロジェクト名や利用AIツールの詳細は記事内では追加ページ参照とされている。
- 経理・財務部門のDX組成事例として、規模感(150件以上・2年)と効果(1万時間超)を定量的に示した点が特徴になっている。
- 大企業の財経バックオフィスが業務削減を継続的に積み上げる運営モデルとして紹介されている。
All Articles
Zenn
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | 個人開発のAI API利用構成と2026年4月の課金額を公開する(サブスク+API連携) | 個人開発者がサブスクと従量APIを組み合わせた2026年4月のAI利用構成を公開し、ツール別の月額と用途内訳を実額ベースで開示している。 | @TakumiTOKUNAGA | 00:14 |
| 2 | 高配当株は「買う」もの、倍増配株は「育てる」もの。YOCと出口戦略の話 Claudeと一緒に倍増配株を探す #8 | Claudeと共同で倍増配株を探す連載第8回で、YOC(Yield on Cost)と出口戦略の観点から銘柄評価フレームを整理している。 | @レイン│Claude×投資ラボ | 00:00 |
| 3 | Claude Code /fewer-permission-prompts で許可リストを最適化する【permission】 | Claude Codeの /fewer-permission-prompts スラッシュコマンドで頻出ツールを許可リスト化し、確認プロンプトの発生を抑える運用手順を解説している。 | @どらやき | 00:00 |
| 4 | Claude Cowork × Slack でClaude最新情報を自動収集 | Claude CoworkとSlackを連携させ、Claude関連の最新アップデートを自動収集してSlackチャンネルに投稿する自動化フローを構築した事例を紹介している。 | @とむ | 22:04 |
| 5 | 【AIエージェント自作】tool_useを理解してツールを作る | AnthropicのMessages APIのtool_use仕様を解説し、ファイル読み取りとコード検索を備えた自作AIエージェントを実装する手順を示している。 | @pekopugu | 21:40 |
| 6 | AmiVoice API × Claude で作る「ポッドキャスト全自動編集サービス」 | AmiVoice APIで音声認識を行い、Claudeで構成・要約を生成するポッドキャスト全自動編集サービスを構築した個人開発記録を解説している。 | @Nobalto | 00:00 |
| 7 | 何を楽しみにすればいいのか?みんなが夢中なネット消費を、楽しめなかった | ネット消費に没入できなかった筆者が、AI時代の楽しみ方や情報摂取スタイルを再構築する過程を綴ったエッセイを公開している。 | @kako-jun | 00:00 |
| 8 | Commit前に監査をいれる | Claude Codeのhookを使ってコミット直前にAI監査を挟み、機微情報や不適切な変更を自動検出するワークフローを提案している。 | @yukineko | 00:00 |
| 9 | Claude Code と Datadog MCP で、SRE エージェントの評価から改善まで一気通貫でやってみた | LayerXのSREチームがClaude Code+Datadog MCPでLLM Observabilityを設定し、オンライン評価とオフライン実験の2層でAIエージェントを継続改善した実装記を報告している。 | @ishiken | 00:00 |
| 10 | Claude Managed Agentsで「まずエンジニアに聞こう」を「まずbotに聞こう」に変えた | DiniiがClaude Managed AgentsでSlackボット「@ask-anything」を構築し、4週間でdev-helpチケットを半減・エスカレーション率を100%から22%に下げたと報告している。 | @まりる | 00:00 |
| 11 | Anthropic Drops the Opus 4.8 Bomb — And This Time It Is Personal(Anthropic、Opus 4.8を投下——今回は個人体験を変えに来た) | Claude Opus 4.8の発表内容を英語でレビューし、忖度抑制・誠実性強化・SWE-Bench Proスコアなどの観点から従来モデルとの違いを整理している。 | @NeoTechPark | 00:00 |
| 12 | MCPを実際に繋いでみる——GitHub・Notion・Slack 3つの実例【中級Ch2】 | Claude CodeとGitHub・Notion・SlackをMCP経由で接続する3つの実例を順を追って示し、各連携で必要な設定とアクセス権を解説している。 | @シュンク堂 | 10:07 |
| 13 | AI時代にAIっぽいアプリをAIとVibes Coding | あえてAIらしさを残したUIを目指し、Vibes Codingの手法でClaudeと対話しながらアプリを試作した過程と気付きを記録している。 | @たると | 00:00 |
| 14 | ChatGPT PlusのProjectsだけでプログラミング言語を作り始めて早6週間 | ChatGPT PlusのProjects機能のみを使い、6週間かけて新規プログラミング言語を設計・実装した経過と詰まりどころを公開している。 | @黒ヰ樹 | 23:55 |
| 15 | ChatGPTのようなふつうのAIと、Claude Codeは種類が違う | 汎用チャットAIとClaude Codeの違いを「対話か実行か」という観点で整理し、どちらをどう使い分けるべきかをエンジニア以外にも分かる言葉で解説している。 | @超効率厨 | 21:34 |
| 16 | OpenAIのAIスーパーアプリ戦略を一次情報から読む | ChatGPT・Codex・AtlasをOpenAIが3月31日に「unified AI superapp」として位置付けたと整理し、6月2日のCodex再定義など一次情報をたどって戦略を解読している。 | @太田和彦 | 17:19 |
| 17 | Claude Code・ChatGPT・GeminiとMac3台で399個のWebサービスをAI駆動運用している話 | Mac 3台にClaude Code・ChatGPT・Geminiを役割分担で配置し、399個のWebサービスをAI駆動でローテーション運用しているインフラ構成を公開している。 | @AppADayCreator | 11:49 |
| 18 | Microsoft Build 2026 技術者向けイベントだが、SIer企業経営者がAI前提で今すぐ決断すべき内容であった | Microsoft Build 2026のCopilot OS化・Scout・MAIモデルファミリの発表内容を整理し、SIer経営層が労働時間ベースのビジネスから脱却すべき理由を提示している。 | @satoshi yoshida | 23:42 |
| 19 | AI駆動開発手法の現在地と展望 | Vibe CodingとAI-DLCを軸にAI駆動開発手法の現状を俯瞰し、設計レビューと実装の主導権をAIに移すための要件を整理している。 | @YuzuNatsuki | 23:27 |
| 20 | 日本のメガベンチャーが好きなAIってなんだ、どー使ってる? | 日本のメガベンチャー各社のAI採用傾向を調査し、モデル性能よりも実装し続ける運用力を優先する姿勢が共通していると結論付けている。 | @Daniel_nanami_shiota | 23:26 |
| 21 | NVIDIA Locate Anything-3Bを試してみました | NVIDIA Locate Anything-3Bの推論コードを動かし、画像内の任意オブジェクト位置特定タスクの挙動と精度を実例コード付きで検証している。 | @Hitoruna | 23:21 |
| 22 | Supabase をムンバイから東京に移行したらDBレイテンシが1/3になった話 | Supabaseのリージョンをムンバイから東京に移行することでDBレイテンシが1/3になったと報告し、移行時の手順と注意点を残している。 | @株AI分析アプリを一人で作ってる人 | 23:16 |
| 23 | Open VSXで「拡張機能のバージョン不適合エラー」が出たときの対処法 | Open VSX経由で発生する拡張機能バージョン不一致エラーの原因を切り分け、フォークIDEで動かすための互換性回避策を提示している。 | @sjm3610 | 23:07 |
| 24 | AIに「任せるか自分でやるか」を、気合いで決めるのをやめる | 比較優位と機会費用の概念をAI委任判断に持ち込み、「気合い」ではなく数値で委任可否を決めるフレームを提案している。 | @あきらパパ | 22:48 |
| 25 | エージェントに「脆弱性を探して」はなぜ失敗するのか | Cloudflareが50+リポで構築した7段階のharness(Recon→Hunt→Validate→Gapfill→Dedupe→Trace→Feedback)を解説し、単独エージェントへの素朴な脆弱性検出依頼が失敗する理由を示している。 | @AIウォッチ | 22:29 |
| 26 | RAGでトレンドを要約するのをやめたら、欲しかったのは「共通ルール」だった | ファッショントレンドのRAG要約を試した著者が、本当に有用なのは個別記事の要約ではなくドメインの共通ルール抽出だったと結論付けている。 | @mofuteq | 22:15 |
| 27 | 【第8回】Microsoft Agent Frameworkで学ぶAIエージェント設計原則 | Microsoft Agent Frameworkのシリーズ第8回として、最小権限原則をAIエージェントに適用し、全Agentに全ツールを渡さない設計を解説している。 | @伊武 成彰 (naruaki ibu) | 21:44 |
| 28 | Just Train Twice 論文解説 | 失敗サンプルに重み付けして2回学習することで分布シフトに対するロバスト性を高めるJust Train Twice論文の手法と数式を解説している。 | @mantis_ryuji | 20:19 |
| 29 | Claude Code が育てる言語化能力 | Claude Codeへの指示精度を上げる過程が人間同士の説明力強化にも転用できると論じ、AI使用が言語化能力の鏡として機能すると述べている。 | @saitoko | 20:03 |
| 30 | 「人間性」の幻視:自然言語であることの辛さ | 自然言語インターフェースが「AIには分かっているはず」という幻想を生む構造を分析し、対話UIに潜む期待値ズレの問題を提起している。 | @bluegrass | 19:30 |
| 31 | GitHub Copilot の Custom Agent で Azure Updates をまとめてみる | GitHub CopilotのCustom Agent機能でAzure Updatesを自動収集・整理する独自エージェントを構築する手順を示している。 | @takutsu | 18:30 |
| 32 | 増え続けるユーザーフィードバックを人力で整理するのをやめた話 | Slackに蓄積されるユーザーフィードバックの人力整理をやめ、分類・タグ付け・要約をAIで自動化するパイプラインを構築した過程を記録している。 | @peggykang | 18:09 |
| 33 | AIと本気で協働して気づいた「人間の判断」の置き場所 | AIと本格的に協働した上で、人間の判断・承認・学習・説明責任をどこに残すべきかを定義した「waku2-ai-protocol v0.1.0」を提案している。 | @waku2_eng | 17:37 |
| 34 | 【Snowflake Summit 2026】Snowflake CoWorkで変わる「データに聞く」から「仕事を進める」への進化 | Snowflake Summit 2026のCortex AgentsとCoWorkの発表内容を整理し、データクエリから業務遂行へとSnowflakeの提供価値が拡張したと分析している。 | @Takumi | 16:59 |
| 35 | LLM開発・活用の全体像:仕組みから実務応用まで | LLMの仕組みから学習フロー、業務適用、運用リスク管理までを一本にまとめ、これから始める担当者向けに全体像を俯瞰する解説記事を提供している。 | @Kawamura | 19:43 |
| 36 | iPhoneのローカルLLM:GPUは短距離、Neural Engineは長距離(熱スロットリング実測) | iPhone上のローカルLLM実行でGPUとNeural Engineの長時間生成における熱スロットリングを実測し、ANEが長距離走に向くと結論付けている。 | @MLBoyだいすけ | 17:08 |
| 37 | エージェントの記憶は「ベクトル検索」では足りない:2026/6/4 arXiv 3本が示す設計転換 | 6月4日付arXivのエージェント記憶系論文3本を読み比べ、ベクトル検索のみでは不十分で、構造化メモリと階層化が必要になる設計転換を整理している。 | @中村 啓 | 16:53 |
| 38 | Wesnoth派生ゲームに追加するAIエージェント同士の対戦機能の仕様考察 | Wesnoth派生戦略ゲームに導入するエージェント対戦機能の仕様を、プロンプト変動と確率性が戦力に与える影響を含めて考察している。 | @robobuncho | 15:54 |
| 39 | なぜ、「AIエージェント」はユーザーをバカにした不誠実なワードなのか? | 「AIエージェント」という言葉の曖昧さがユーザー誤解を生むと主張し、IT業界の用語不誠実史の中に位置付けて批判している。 | @pdfractal | 15:37 |
| 40 | 広告コピー10案を一括生成するLLMシステムの実装【Google/Meta/X対応】 | Google・Meta・X向けに広告コピー10案を一括生成するLLMシステムの実装手順をプロンプト設計とA/B運用の観点から解説している。 | @尾崎功汰 | 14:53 |
| 41 | Gemini APIのPrompt Cachingで会話履歴を効率的に管理する(Go言語編) | Gemini APIのPrompt Cachingを用いて会話履歴を効率管理する実装をGoで提示し、トークン削減量とキャッシュ更新タイミングを示している。 | @JJ yamitake@yapr | 12:54 |
| 42 | 【BigQuery】ナレッジグラフ × LLM自律分析エージェントを作って比較してみた | BigQueryのプロパティグラフ機能でナレッジグラフを構築し、LLM自律分析エージェントと組み合わせて多テーブル横断クエリの精度を比較した実験を報告している。 | @zaiwa | 12:16 |
| 43 | AIエージェントが本番で壊れる3つのパターンと、設計で防ぐ方法 | AIエージェントが本番で破綻する典型3パターンを抽出し、デプロイ前に確認すべき検証チェックリストとして提示している。 | @リベルクラフト | 11:09 |
| 44 | Claude Code「Dynamic Workflows」完全ガイド:6つのパターンと14ステップ | 5月28日リリースのClaude Code Dynamic Workflowsについて、6つの設計パターンと14ステップの実装ロードマップを体系化している。 | @アリヘイ | 10:25 |
| 45 | RAGの事実をピンポイントで書き換える — ROME論文から学ぶ「知識編集」とその危うさ | ROME論文の知識編集手法を例にRAGの事実を直接書き換える技術を解説し、セキュリティリスクと改変検知の難しさを整理している。 | @Masayoshi Kurihara | 10:00 |
| 46 | 機密情報はなぜLLMから漏れるのか?OWASP LLM02 Sensitive Information Disclosureを解説 | OWASP LLM02を題材にSamsungの社内情報漏洩事例を引用し、機密情報がLLMから漏れる経路と組織的統制ポイントを解説している。 | @mapellion | 10:00 |
| 47 | 🤖 生成AIモデルの隠れ層に超伝導量子コンピュータの量子回路をドッキングさせてみた | 生成AIモデルの隠れ層に超伝導量子コンピュータの量子回路を接続する実験コードを公開し、ハイブリッド推論の挙動を観察している。 | @YuichiroMinato | 00:00 |
| 48 | 2つのAIキャラに価格交渉させてみた!ヒョウ柄オカン🐆vs頑固オオカミ🐺 | 性格設定の異なる2キャラクターAIに価格交渉を行わせ、ロールプレイ条件下での妥結傾向と挙動の差を観察した実験記録を公開している。 | @miki-mini | 00:00 |
| 49 | Azure DI × Geminiで「テンプレ設定不要」なAI-OCRを爆速でPoC開発 | Azure Document IntelligenceとGeminiを組み合わせ、テンプレ設定なしで非定型帳票を読み取るAI-OCRのPoCを短期間で構築した手順を共有している。 | @hor | 00:00 |
| 50 | Gemini が生成するインタラクティブ3Dモデルと Interactions API 入門 | Geminiが生成するインタラクティブ3Dモデルと新Interactions APIを用い、ブラウザ上で操作可能なシミュレーションを構築する入門記事を提供している。 | @甲斐 甲 | 00:00 |
| 51 | AI に「人格」を書いたら、業務連絡が消えた話 | CLAUDE.mdとagentファイルに人格設定を書き込むことで、無味乾燥だった業務連絡が個性的なやり取りに変わった事例を紹介している。 | @ひらの ともか | 21:52 |
| 52 | Claude Code での壁打ちの振る舞いを自分好みに変えてみよう | Claude Codeのスラッシュコマンドを使い、壁打ちセッションのトーンと聞き返し頻度を自分好みにカスタマイズする方法を解説している。 | @a.kobayashi | 18:27 |
| 53 | 学生が Claude Code × Obsidian で「毎朝AIが書く第二の脳」を作った全手順 | 学生エンジニアがClaude CodeとObsidianを連携させ、毎朝AIが書く日次ブリーフィングと週次レビューを自動生成する仕組みを構築した手順を全公開している。 | @しゅうや@AIエンジニア | 16:06 |
| 54 | せっかく作ったアプリが「AIっぽい」だけで避けられないようにするには? | AI生成感の強いUIが敬遠される現象を踏まえ、デザイン原則を意識して「AIっぽさ」を抑える具体的な対策を整理している。 | @チビスラ | 14:48 |
| 55 | 週 5 時間・月 3,000 円から始める副業設計 | 13個の副業案を週5時間・月3,000円という制約条件で絞り込み、最終2案を選定するまでの判断プロセスを公開している。 | @Takano | 12:58 |
| 56 | aiterm-mcp を npm に公開した | 永続ターミナルセッションをAIに提供するMCPサーバ「aiterm-mcp」をnpmに公開し、再接続コストを削減するアーキテクチャを解説している。 | @QuoLu | 10:40 |
| 57 | Claude Code の Skills と Commands の作り方がわからんかったのでまとめた件 | Claude CodeのSkillsとCommandsの作成手順をゼロからまとめ、繰り返しタスクをテンプレ化するための具体的な書き方を解説している。 | @拓田しろう | 09:33 |
| 58 | Amazon S3 Vectors でRAGを作って『大規模化のボトルネック』を実測で確かめた | Amazon S3 VectorsでRAGを構築し、データセット拡大時のスループットとレイテンシのボトルネックを実測したベンチマーク結果を共有している。 | @シヴィルドット | 00:00 |
| 59 | エージェントが本番で黙って止まる4つの場面と、物理で防ぐパターン — AOS v0.2 | AIエージェントが本番でサイレント停止する4シナリオを整理し、AOS v0.2として物理層で停止を防ぐパターンを提案している。 | @AOS Architect | 00:00 |
| 60 | CursorはIDEを超える:vaultとMCPで考える業務文脈操作基盤 | CursorをIDEとしてではなく業務文脈操作の基盤として位置付け、ナレッジvaultとMCPの組み合わせで操作対象を拡張する設計を提案している。 | @tomyuk | 00:00 |
| 61 | Claude APIで自動売買エージェントを個人開発した話 | Claude APIを使って自動売買エージェントを個人開発した過程をパイプラインとリスク管理の観点から解説している。 | @inowa_r | 00:00 |
| 62 | Slackを起点としたTableau MCP活用を考える #1 | Slackを入口にTableau MCPを呼び出してダッシュボード情報を取得する活用構想を整理し、運用フローと注意点を提示している。 | @しんや | 00:00 |
| 63 | AIエージェントの記憶、昇降格TTL運用術 | AIエージェントのメモリを階層化し、TTLに基づいて短期記憶と長期記憶を昇降格させる運用パターンを提案している。 | @エージェントメモリーズ | 00:00 |
| 64 | Roblox Studio × Claude Code をMCPで繋ぐ | Roblox StudioとClaude CodeをMCP経由で接続し、ゲーム制作の試作をAI支援で高速化するブリッジ実装を公開している。 | @かめぞー | 00:00 |
Qiita
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | Claude Code v2.1.162: 権限制御バグ修正とagents大幅改善まとめ | Claude Code v2.1.162のリリースノートを整理し、WebFetch権限適用漏れやWindowsパスマッチング不具合の修正と、agents機能の大幅改善内容をまとめている。 | @picnic | 23:43 |
| 2 | Claude Code hooks 活用まとめ — 安全性・ログ・作業時間を全自動化する | Claude Code hooksを使って安全性チェック・作業ログ収集・作業時間計測を自動化する具体例を、サンプルスクリプト付きで紹介している。 | @satoshi_061 | 22:45 |
| 3 | Claude Code hooks設定まとめ — 音声読み上げ&macOS/Windows通知を自動化する | 長時間タスクの完了見落としや権限確認停止に対処するため、Claude Code hooksで音声読み上げとmacOS/Windows通知を自動化する設定を共有している。 | @satoshi_061 | 18:58 |
| 4 | Codexがえらいこと進化してたけどみんな知ってた?(画像生成・スマホ連携) | Codexが画像生成とスマホ連携機能を備えていた事実を取り上げ、追加された具体機能と試した操作感を実体験ベースで紹介している。 | @robitan | 20:47 |
| 5 | 【論文で読み解く】AIのクリエイティビティはどこまで伸びる? | 創造性研究の論文を引きながら、AIの創造性が小説家・脚本家など人間クリエイターをどこまで代替できるかを分析している。 | @yamantyosu | 19:26 |
| 6 | 【競馬AI】日本ダービーをNotebookLMでデータ予想してみた【実践編】 | NotebookLMに20年分のレースデータを読み込ませて日本ダービーの結果予測を行い、AIの推論手順と結果の精度を検証している。 | @gaia_dev | 23:43 |
| 7 | 【競馬AI】日本ダービーをNotebookLMでデータ予想してみた【NotebookLM準備編】 | 日本ダービーAI予測の前段として、NotebookLMにレース結果や馬の戦績データをアップロードする設定手順を解説している。 | @gaia_dev | 23:42 |
| 8 | 【競馬AI】日本ダービーをNotebookLMでデータ予想してみた【データ準備編】 | 競馬データを収集・整形する自作ツールと、過去レース情報の前処理工程を順を追って解説するデータ準備編を提供している。 | @gaia_dev | 23:40 |
| 9 | ”AI革命は産業革命に匹敵” チームみらい・安野氏らITコンサル界隈の言説は本当か? | チームみらい・安野氏らITコンサルが語る「AI革命≒産業革命」という主張を、経済理論とデータをもとに検証し、過大評価の論点を整理している。 | @JKUROKI | 19:24 |
| 10 | GPT Image 2入門 — DALL-E 3後継モデルのAPI実装と移行ガイド | 2026年4月にOpenAIが公開したGPT Image 2の概要とAPI実装、DALL-E 3からの移行手順をサンプルコード付きで解説している。 | @kai_kou | 15:00 |
| 11 | Claude Codeから画像をWezTermに表示する方法 | Claude Codeが生成した画像をWezTermのインライン表示機能で開く設定手順を、必要なエスケープシーケンスとともに解説している。 | @degudegu2510 | 14:12 |
| 12 | AIに直させたら「別の場所」が壊れた、の正体 — リファクタリングを壊さない安全網(仕様化テスト)実践ガイド | AIに修正を依頼したときに別箇所が壊れる現象の原因を分析し、仕様化テストでリグレッションを検出する実践ガイドを示している。 | @akira_papa_AI | 22:18 |
| 13 | ColPaliはOCRを捨てる——PDFを「画像のまま」検索する仕組み | ColPaliがOCRを介さずPDFを画像のまま検索する仕組みを解説し、表・グラフ・スキャン書類など従来手法が苦手な領域での優位性を整理している。 | @Yushi88 | 19:54 |
| 14 | MCP用語集【2026年版】設計・トランスポート・セキュリティの頻出用語まとめ | MCP関連の設計・トランスポート・セキュリティ用語を体系的にまとめ、初心者がドキュメントを読む際の参照辞書として使えるよう整理している。 | @ryukiebe0911 | 20:21 |
| 15 | Progressive Enhancement思想で学ぶMCP Apps開発:非対応ホストでも安全に動作するフォールバック設計と実装 | Progressive EnhancementをMCP Appsに応用し、対応ホストでは機能を解放しつつ非対応ホストでも壊れないフォールバック設計を実装する手順を解説している。 | @jjking | 20:08 |
ITmedia AI+
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | TSMC、AI活用拡大による成長維持に自信 | TSMC CEOがAI需要の継続拡大を背景に成長維持に自信を示し、2028年に中国南通工場で先端3nm生産を立ち上げる計画と日本での新規土地取得を明らかにしている。 | 17:55 |
| 2 | ホンダの人型ロボット戦略 | ホンダの吉池義一執行職がASIMO終了後の人型ロボット戦略を語り、過熱気味のヒューマノイドブームよりも45万回動作実績のある4本指多指ハンド開発に注力すると説明している。 | 03:00 |
GIGAZINE
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | Google Search AI Summary Opt-Out(Google検索AI要約のオプトアウトを実装) | 英CMAが6月3日に課した行動要件に従い、GoogleがSearch Consoleで自サイトをAI Overviews・AI Mode・Discover AI要約から除外可能にしたと報じている。 | 14:54 |
Publickey
| # | Title | Summary | Published |
|---|
対象日に該当する記事はありませんでした。
OpenAI Blog
| # | Title | Summary | Published |
|---|
対象日のJST時刻が確定できる記事はありませんでした。
Google AI Blog
| # | Title | Summary | Published |
|---|
対象日に該当する記事はありませんでした。
Hugging Face Blog
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | Nemotron 3.5 Content Safety(Nemotron 3.5 コンテンツセーフティ) | NVIDIAがNemotron 3.5世代向けのコンテンツセーフティモデルを公開し、安全カテゴリの判定精度と推論コストのバランスを示している。 | 00:00 |
| 2 | EVA-Bench Data 2.0(EVA-Bench データ2.0) | ServiceNow AIがEVA-BenchのデータセットをVer.2.0として更新し、評価カバレッジとタスク多様性を拡張したと報告している。 | 00:00 |
| 3 | Designing the hf CLI as an agent-optimized way(hf CLIをエージェント最適化形式で再設計) | Hugging Faceがhf CLIをAIエージェントから扱いやすい入出力形式に再設計したと発表し、コマンド構造の見直し点を解説している。 | 00:00 |
Simon Willison
| # | Title | Summary | Published |
|---|
対象日に該当する記事はありませんでした。
The Decoder
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | OpenAI CEO Sam Altman sees “proactive AI” as the next big phase after chatbots and agents(Sam Altman、次の段階は常時稼働の「プロアクティブAI」だと提示) | Sam Altmanがチャット・エージェントに続く第三段階を「proactive AI」と定義し、UberがQ1で年間AI予算を使い切った事例を引きながらコスト最適化が普及の鍵だと述べたと報じている。 | 22:25 |
| 2 | AI can now coach amateur virologists, and top tech leaders want Congress to act on DNA security(Altman・Amodei・Hassabisら、AIがアマチュア病原体製造を支援できる時代のDNA合成審査を米議会に要請) | OpenAIのAltman、AnthropicのAmodei、Google DeepMindのHassabis、MicrosoftのSuleymanら経営層と、ノーベル賞のBaker・Hellman両氏が連名で、合成DNA発注のスクリーニング義務化を米議会に求めたと報じている。 | 19:07 |
Hacker News
| # | Title | Summary | Published |
|---|
対象日に該当する記事はありませんでした。