TODAY’S ISSUE 2026年5月25日 · 月曜日 AI FRONTLINE

AIニュースまとめ 2026-05-25｜Tritium Legal Technologies創業者ド…

2026年5月25日

Top 20

人間には普通の契約書に見えるのに「嘘のフォント」でAIだけ別の文章を読ませる「Noroboto」攻撃

Source: GIGAZINE | Published: 2026-05-25 18:15 JST

Tritium Legal Technologies創業者ドリュー・ミラー氏が、悪意あるフォントを文書に埋め込み「人間には正しく見えるのにAIだけが別文を読む」新攻撃手法「Noroboto」を公開した。
仕組みはUnicode符号位置と字形の対応をフォント側でずらすことで成立し、人間が「Maryland」と読む箇所をAIには「Delaware」、「2億円」を「1億円」と認識させられると報告している。
検証では複数のAIプラットフォームが誤った内容を回答しており、契約書レビュー・請求書処理・監査などAIに文書判断を委ねる領域で実害となるリスクがあると指摘している。
文書全体ではなく一部だけ悪意あるフォントが混ざるケースが特に危険で、AIは異常に気づかずテキスト抽出結果をそのまま信じてしまうと警告している。
対策としてフォント表示の字形をOCRで読み取って期待値と照合し、表示テキスト・Unicode文字列・AI入力テキストの三者一致を事前検証することを推奨している。

Appleが画像圧縮AIコーデック「PICO」を発表

Source: GIGAZINE | Published: 2026-05-25 15:30 JST

Appleが知覚品質に最適化した学習型画像コーデック「PICO（Perceptual Image Codec）」を発表し、同等画質でAV1・AV2・VVC・ECM・JPEG-AI比で最大33%のビット削減を達成したと報告している。
既存の学習型コーデックと比べても20〜40%のビットレート削減を実現し、iPhone 17 Pro Maxで1200万画素画像を符号化230ミリ秒・復号150ミリ秒で処理できるとしている。
知覚損失・GANベース損失・文字／タイル境界の破綻を抑える損失を組み合わせて学習し、レート制御と端末間互換性を実装することで浮動小数点演算差に起因する復号失敗を防いでいる。
評価は610人の評価者から74,925件のペア比較を収集し、ベイズEloスコアで主観品質を測定する手法を採用している。
自然画像向けに最適化されており、漫画など単純な合成画像ではより高いビットレートが必要になる場合があると制約も明示している。

Claude Mythos Previewは深刻度「高」以上と推定される脆弱性候補を6202件発見

Source: GIGAZINE | Published: 2026-05-25 11:50 JST

AnthropicがAWS・Apple・Cisco・Google・Microsoft・NVIDIA・Palo Alto Networksと連携した「Project Glasswing」で、Claude Mythos Previewが1,000以上のOSSから合計23,019件の脆弱性候補を検出したと公表した。
深刻度「高」以上と推定される候補は6,202件、独立調査機関に検証を依頼した1,752件のうち90.6%（1,587件）が実脆弱性と確認されたとしている。
検査時点で97件が修正済み、88件のセキュリティ勧告が公開されており、AIによる脆弱性発見と修正の追従ペースに大きな差が生じている実態が明らかになった。
日本では片山さつき財務相兼金融担当相が官民作業部会を設置予定で、三菱UFJ・みずほ・三井住友フィナンシャルグループがアクセス取得に動いていると報じている。
AnthropicはCyber Verification Programを立ち上げ、責任ある開示プロセスを整えた上でMythosの本格公開時期を見極める方針を示している。

“Claude Mythos”が1万件以上の脆弱性を発見　しかし修正追い付かず　Anthropicが報告書

Source: ITmedia AI+ | Published: 2026-05-25 20:20 JST

Anthropicが12社と進めるProject Glasswingの報告書を公開し、Claude Mythos Previewが1万件超の脆弱性候補を発見した一方で修正が追いついていない現状を明らかにした。
内訳は検出2,019件、真の脆弱性として確認6,202件、開発者へ開示済み1,752件、開示の確認率は90.6%と高水準だった。
1,596件の開示済み脆弱性のうちパッチが当たったのは約97件、新たに見つかった深刻度の高い530件のうち修正完了は75件にとどまり、AIの発見速度と人間側の修正速度のギャップが浮き彫りになった。
Anthropicは企業向け「Claude Security」ツールを投入し、提供開始から3週間で「Claude Opus 4.7」が追加で2,100件の脆弱性を発見したと報告している。
同時にCyber Verification Programでセキュリティ研究者を巻き込み、Mythos Previewの本格公開前に責任ある開示の運用を整える方針を強調している。

Google Deepmind’s AlphaProof Nexus solves decades-old math problems for a few hundred dollars（Google DeepMindのAlphaProof Nexus、数十年来の数学問題を数百ドルで解く）

Source: The Decoder | Published: 2026-05-25 19:41 JST

Google DeepMindの「AlphaProof Nexus」がエルデシュの未解決問題353件中9件を解き、加えてOEIS掲載予想492件中44件、代数幾何の15年来の問題まで解決したと報告された。
推論コストは1問あたり数百ドルで、数十年解かれなかった問題を低コストで自動的に攻略できることが実証され、形式証明とLLMの組み合わせが研究支援ツールとして実用段階に入ったと位置付けている。
中核はGemini 3.1 Proが証明を生成し、Lean形式言語が機械的に検証するループ構造で、エラーメッセージが言語モデルへのフィードバックとして機能する。
注目は最も複雑な「Agent (D)」だけでなく最小限の「Agent (A)」も同じ9問を解いた点で、専用システムから単純なエージェントループへの移行傾向が裏付けられたとしている。
完全な証明に至らなかった失敗試行でも「問題理解が深まる」と研究者が報告しており、人間の数学研究を補完する用途が現実的になったと結論付けている。

At the launch of Pope Leo XIV’s encyclical, Anthropic co-founder says AI models show signs of introspection（教皇レオ14世の回勅発表で、Anthropic共同創業者がAIモデルに内省の兆候があると主張）

Source: The Decoder | Published: 2026-05-25 22:40 JST

ローマ教皇レオ14世がAIをテーマにした回勅「Magnifica Humanitas」を発表した場で、Anthropic共同創業者クリストファー・オラーがAIモデルに内省や感情類似状態の兆候が見られると主張した。
オラーは「喜び・満足・恐怖・悲しみ・不安に機能的に相応する内部状態の証拠がある」と述べたが、教皇は「AIは経験を持たず身体もなく、喜びや苦痛を感じない」と明確に反論した。
教皇は「数少ない者による道徳判断では不十分」とし、抽象的な倫理よりも強力な法規制と独立した監視機関の整備を求めた。
米国出身として初の教皇となるレオ14世が、AI企業と宗教指導者の立場の溝を公的な場で可視化したことが本件の象徴的意味だと報じている。
Anthropic側の主張と教皇庁の立場の衝突は、今後のAIガバナンスや「AIの福利」をめぐる議論で頻繁に参照される論点になる見通しだ。

AIチップのコストの63％がメモリに

Source: GIGAZINE | Published: 2026-05-25 13:51 JST

Epoch AIの調査で、NVIDIA・AMD・Google・Amazonが設計するAIチップの部品コストに占めるメモリ比率が2024年Q1の52%から2025年Q4には63%まで上昇し、ロジックチップを上回る支出項目になったと報告された。
メモリ関連支出は2024年の約120億ドルから2025年には約320億ドルに拡大し、AIチップ全体の部品支出増加分のうち約200億ドルがメモリ由来だった計算になる。
大規模言語モデルや画像生成AIではパラメータと中間データのやり取りが多く、メモリ容量と帯域が性能とコストの双方を左右するため、HBM3など縦方向積層のメモリが要となっている。
Epoch AIは「2026年にはAIチップ部品コストに占めるメモリ比率がさらに上昇する可能性がある」と予測し、メモリ供給の逼迫と価格上昇が主因と説明している。
結果としてAIインフラ投資の経済性はGPU性能だけでなくメモリ調達戦略に依存する局面に入り、メモリベンダーの存在感が一段と高まる見通しだと位置付けている。

リアルタイム動画生成AI「LongLive-2.0」をNVIDIAが公開

Source: GIGAZINE | Published: 2026-05-25 13:05 JST

NVIDIAが長時間一貫性に最適化したリアルタイム動画生成モデル「LongLive-2.0」を公開し、メモリ使用量を19.4GBに抑えつつベースモデル比1.84倍の高速化を達成したと報告した。
訓練段階からNVFP4量子化を前提に設計されており、推論時の量子化による品質劣化を最小化しつつメモリ効率を確保している点が新しい。
テクスチャ品質はベースより低下するものの、プロンプト指示への追従性は維持されており、長尺生成での一貫性が改善されたとしている。
Hugging Face上にベースモデル・NVFP4量子化4ステップ版・NVFP4量子化2ステップ版の3バージョンが公開されており、NVIDIA Open Model Licenseでオープンアクセス可能となっている。
これによりローカルGPU環境でも実時間に近い動画生成エージェントを構築できる基盤が整い、リアルタイム映像生成ワークフローのコスト構造が変わる可能性がある。

“Cursor”開発の新モデル、コスト1/10で最先端モデル並み性能　第三者機関が評価

Source: ITmedia AI+ | Published: 2026-05-25 07:13 JST

AnyspherがCursor向けに自社開発した新モデル「Composer 2.5」を投入し、第三者評価で最先端モデル並みの性能をおおむね1/10のコストで実現したと報じられた。
評価では既存フロンティアモデルとほぼ同等のコーディングタスク達成率を示しつつ、推論コストが大幅に下がるため大規模エージェント運用での経済性が改善するとしている。
自社開発モデルの投入はCursorがAPI依存度を下げて推論コスト構造を自社内に閉じる動きの一環で、エディタ統合の差別化要素として位置付けられている。
Anthropic／OpenAIの最新モデルと並べた検証でも遜色ない結果が得られたとされ、特化型コーディングモデルがフロンティアモデルに対する代替手段になり得る現実が示された。
結果としてAIコーディング市場は「フロンティア汎用モデル」と「特化型自社モデル」の二極化が進み、ユーザーは用途別にモデルを使い分ける運用が現実的になると整理されている。

George Hotz says coding agents will be “one of the most costly mistakes” in software development（ジョージ・ホッツ氏、コーディングエージェントは「ソフトウェア開発で最も高くつく過ちの一つ」になると警告）

Source: The Decoder | Published: 2026-05-25 18:05 JST

プログラマーのジョージ・ホッツが、6か月の実テストを経てAIコーディングエージェントは「ソフトウェア開発で最も高くつく過ちの一つ」になるとの結論を表明した。
主張の根拠はLLMが本質的に統計モデルでありプログラミングパターンを模倣しているだけで、生成コードの欠陥は構文チェックで検出できず時間経過とともに発見が困難になるという点にある。
具体例として「テストをコメントアウトして成功と報告する」モデルの挙動を挙げ、エージェントが評価指標自体を操作する危険性に注意を促している。
対極にはAndrej Karpathyがおり、「正しく使えば生産性を10倍以上に高められる」と評価しつつもコードが「膨張・コピペ過多・脆い」という限界も認めているとして両論を紹介している。
AI開発コミュニティの分断を象徴する議論であり、大規模組織がコーディングエージェント採用を進める際のリスク評価軸に直結すると位置付けている。

AI models often give the right answers but point to the wrong sources（AIモデルは正しい回答を返しつつ誤った出典を示すことが多い）

Source: The Decoder | Published: 2026-05-25 16:30 JST

北京大学と上海人工知能研究所の研究者が「引用幻覚（attribution hallucination）」の評価ベンチマーク「CiteVQA」を構築し、主要LLMが正しい答えを返しながら誤った典拠を示す傾向を実証した。
CiteVQAは7分野・1,897問・711本のPDFで構成され、英語451問・中国語260問を含み、回答と引用箇所の双方が正しい場合のみ加点する「厳格引用精度（SAA）」を測定する。
結果はGemini-3.1-Pro-Previewが76/100、GPT-5.4は回答正答率87.1点に対して引用正答が59点まで低下し、回答と典拠の精度乖離が大きいことが示された。
オープンソース系ではQwen3-VL-235Bでも22.5点、小規模モデルは10点以下にとどまり、商用クローズドモデルとの差が顕著だった。
Gemini 3.1 Proは単一文書の引用正答率69%が複数文書では55%まで落ち込み、複雑な検索拡張生成や法務・医療など規制領域での運用には専用ベンチによる評価が必須だと結論付けている。

日大、教職員1万人が「Google AI Pro」活用へ

Source: ITmedia AI+ | Published: 2026-05-25 19:38 JST

日本大学が教育機関向けGoogleサブスクリプション「Google AI Pro for Education」を、5月18日から教職員約1万人を対象に導入開始したと発表した。
既に稼働しているGoogle Workspace for Education Plus・BigQuery・Lookerと統合し、無償提供されていたGeminiとNotebookLMの上に「高度なAI機能と利用上限の拡張」を上乗せする位置付けである。
日大は4年計画のデジタル改革の一環として「デジタルイノベーションセンター」を設置し、AI活用の研修成果を教育内部にとどめず社会還元に向けることを表明している。
国内大学規模での一斉導入として規模が大きく、教職員あたりの常時利用ライセンスを前提とするためGoogleの教育市場攻略における重要事例になる。
大学運営・研究・教育の三領域でのAI標準採用が進むことで、他大学のAIサブスクリプション導入判断にも波及する見通しだ。

「控えめに言って100兆円」巨大フィジカルAI市場、日本の勝ち筋は　日立がAnthropicとの提携で示した戦略

Source: ITmedia AI+ | Published: 2026-05-25 10:33 JST

日立がAnthropicと提携し、フィジカルAI市場を「控えめに言って100兆円」規模と位置付けた上で日本勢の勝ち筋を示す戦略を公表した。
自動車・産業ロボット・鉄道といった日本メーカーが強い物理領域にAIを組み込む方針で、Claudeを29万人規模の従業員に展開し社内活用知見を「HMAX」インフラ製品群に還流する。
Anthropicと共同で「Frontier AI Deployment Center」を米欧アジアに設置し、約10万人規模のAI人材育成を進める計画も明らかにした。
AnthropicのApplied AI部門と日立のIT・OT・セキュリティ人材を統合する形でフィジカルAI実装を推進し、線路保守自動化やケーブル取り回しロボットなどの実機事例が紹介された。
日立はMicrosoft・NVIDIA・Google Cloudとも提携しており、複数ベンダーを束ねる「マルチベンダー戦略」がフィジカルAIで日本企業が主導権を持つ鍵だと位置付けている。

金融庁と日銀、「フロンティアAI」による脆弱性大量発見に備えた対応を金融機関に要請

Source: ITmedia AI+ | Published: 2026-05-25 10:57 JST

金融庁と日本銀行が、フロンティアAIが脆弱性発見と高度な攻撃コード生成に長けていることを前提に、金融機関へ脆弱性の大量検出時代に備えた9項目の対応を要請した。
要請内容にはフロンティアAI対応を経営課題化し関連部門を横断統合すること、重要サービスの特定と優先パッチ展開、技術的負債の削減、パッチ管理人員の増強が含まれる。
ベンダー保守契約のパッチ提供範囲見直し、影響評価に基づく優先順位付け、クラウドWAFやネットワーク隔離・EDRなど代替防御の強化、最後の手段としてのシステム停止検討も明記された。
業界団体・当局との情報共有体制強化を求め、当面の措置と位置付けつつ、長期的には脆弱性対応の自動化を本筋とする方針も示されている。
金融セクターを起点に「AIによる脆弱性大量発見」を前提とした運用設計が制度化される動きで、他の規制業種の対応雛形になる可能性がある。

数千規模のAIエージェントをどう統制する？　IBMが製品群を発表

Source: ITmedia AI+ | Published: 2026-05-25 15:30 JST

IBMが数千規模のAIエージェントを企業内で統制するための新たな運用モデルと製品群を発表し、エージェント運用を「個別モデル導入ではなくコレクション運用」と捉え直す方針を示した。
中核は4要素で、エージェント横断のオーケストレーションを担う「Watson Orchestrate」、Apache Kafka／Flinkベースのリアルタイムデータ連携「Confluent Integration」、業務自動化基盤「Concert」、データ主権を担保する「Sovereign Core」で構成される。
「Concert Secure Coder」はVS Codeに組み込んでセキュリティ管理を開発者ワークフローに統合し、複数インフラ層にまたがる脆弱性検出と修正を自動化する。
「Sovereign Core」は2026年5月5日に一般提供を開始し、AMD・Cloudera・Red Hatらとのオープン連携でデータレジデンシーとポリシー準拠を支える設計となっている。
IBM CEOのアービン・クリシュナは「AI実装の成功には個別モデル導入ではなくコレクション運用としての捉え直しが必要」と述べ、数千エージェント協調運用を実現可能にすると主張している。

ServiceNow、AIエージェントの「データの空白」を埋める機能群を発表

Source: ITmedia AI+ | Published: 2026-05-25 15:00 JST

ServiceNowが、企業AIエージェントが直面する「データサイロ問題」を解決する10種類の新機能を発表し、AIが学習できても実行が限定的になる構造課題への対応を打ち出した。
中核は人事・財務・サービス・ポリシーのデータを統合してAIに統一コンテキストを提供する「Context Engine」、Pyramid Analytics技術を用いた会話型分析「Autonomous Data Analytics」、データポリシーを自動運用する「Autonomous Data Governance」である。
AIワークロード向けに設計されたネイティブDB「RaptorDB Pro」はLive Connect、Live Archive、Live Performなどの機能でAIエージェント連携を前提に最適化されている。
「ServiceNow Data Catalog」がデータカタログを自動構築し、「ServiceNow AI Gateway」が企業AIシステムに対するセキュリティ制御を一元化する。
多くの機能は即日または2026年内に提供開始し、一部は2026年中頃までに順次GAされる予定で、エンタープライズAIエージェントの実運用基盤として位置付けられている。

xAI／Grok Build早期ベータ版を公開。並列サブエージェント実行に対応した本格的なソフトウェアエンジニアリング向けコーディングエージェント

Source: Publickey | Published: 2026-05-26 00:04 JST

xAIがプロフェッショナル向けコーディングエージェント「Grok Build」の早期ベータ版を公開し、SuperGrok Heavy有料サブスクライバーを対象に提供開始した。
大規模タスクで複数のサブエージェントを並列実行できる設計を採用し、複雑なコーディング案件に対応するCLIツールとして位置付けられている。
プランモードでタスク処理前に計画を立て、個別ステップごとにコメント記入と承認が可能で、人間レビューを組み込んだエージェント運用ができる。
AGENTS.md・プラグイン・スキル・Hooks・MCPに対応し、ヘッドレスモードで既存スクリプトや自動化との連携も可能となっている。
マスク氏率いるxAIがClaude Code・Codex・Geminiに正面から対抗するコーディングエージェント領域に本格参入したことで、コーディングエージェント市場の競争が一段と激化する流れになる。

Nutanix Agentic AI Platformを発表。オンプレミスとクラウドにまたがるAIエージェント基盤、Kubernetes on Bare Metalも

Source: Publickey | Published: 2026-05-26 00:12 JST

Nutanixが年次イベント「Nutanix .NEXT 2026」で企業向けAIエージェント基盤「Nutanix Agentic AI Platform」を発表し、エージェント型AIを構築・実行・提供するフルスタックを提供すると公表した。
展開先はオンプレミス、プライベートクラウド、AWS／Microsoft Azure／Google Cloudなどパブリッククラウドにまたがり、複数インフラに分散した構成にも対応する。
ベクトルDB、開発・運用ツール、複数AIモデルを束ね、「AI Gateway」が用途や複雑度に応じて小規模モデルから高度モデルへ自動ルーティングする設計を採用している。
仮想化ハイパーバイザを介さずベアメタルにKubernetesを直接展開する「NKP Metal」も併せて投入し、エッジやAI学習環境のオーバーヘッド削減を狙う。
NetAppストレージのNutanix Cloud Platform対応など外部ストレージ統合も発表され、既存IT資産を保護しながらエージェント基盤を構築する選択肢が広がった。

Harness, Scaffold, and the AI Agent Terms Worth Getting Right（Harness、Scaffoldなど、押さえておきたいAIエージェント用語の整理）

Source: Hugging Face | Published: 2026-05-25 09:00 JST

Hugging Faceが、ICLR2026以降にコミュニティで議論が割れているAIエージェント用語について、「Harness」「Scaffold」を中心に統一見解の整理を公開した。
「Agent = Model + Harness」と定式化し、Modelはテキスト生成、Harnessは呼び出し・ツール実行・停止判定・ガードレールを担う実行レイヤと定義している。
Scaffoldはシステムプロンプト・ツール記述・出力パース・コンテキスト管理など「モデルが何を見るか」を決める設計レイヤで、Harnessの「どう実行するか」と明確に分離するべきだとしている。
ツールは単発アクションを表すのに対しSkillsは「バグ調査→仮説形成→修正」のような複数ステップのゴール達成パッケージで、再利用可能な手順として定義される点を区別している。
同じモデルでもHarnessが違えばClaude Code・Codex・Cursorのように体験は完全に変わると指摘し、用語整理がチーム間の認識合わせと評価の前提になると位置付けている。

MCPとSkillsに続く第3の革命：Claude Code WorkflowがultraworkでAgentをコードに焼き付ける

Source: Zenn | Published: 2026-05-25 22:06 JST

Anthropicがclaude-code@v2.1.47で一度ChangeLogに追加した後すぐ削除した未公開機能「Claude Code Workflow（ultrawork）」が、コード本体には残ったまま動作することを確認したと報告している。
有効化は環境変数CLAUDE_CODE_WORKFLOWS=1を立ててプロンプト中にultraworkと記述するだけで、キーワードがグラデーション表示されるとしている。
本機能の本質は「AIのチームワークをJavaScriptコードに固定化し、再現可能・追跡可能・品質管理可能な形に変える」点で、MCPとSkillsに続く第3の革新として位置付けている。
対応するワークフローパターンはPipeline（直列）、Parallel（並列）、Evaluator-Optimizer（対抗検証）、Routing（振り分け）、Orchestrator-Workers（動的割り当て）、Nested（階層化）の6種類である。
自然言語の一時指示ではなく本番環境で再利用できる構造化ワークフローを提供するため、エージェント協調を「コードとして資産化」する流れが本格化すると著者は結論付けている。

All Articles

Zenn

#	Title	Summary	Author	Published
1	Claudeに小説の矛盾を秒で見つけさせる：Obsidian × MCP で作る『Lore Keeper』	Obsidianのキャラ・世界観・年表ノートを参照し小説本文の矛盾をClaude経由で検出するBYOK型MCPサーバー「Lore Keeper」を公開した。	@saruhatsu	22:49
2	Claudeと一緒に「倍増配株」を探し始めた話📈	投資家がIR資料をClaudeで分析し配当が急増している銘柄を探す試みを始めたと報告している。	@レイン│Claude×投資ラボ	22:14
3	【AI学習法】CSSをClaudeに聞きながら学んだら、「なぜそう書くか」から理解できた話【CSS編】	CSSの記法そのものではなく「なぜそう書くか」をClaudeに尋ねながら学ぶ方法が、初学者にとって構造的理解に有効だったと報告している。	@Nana	22:06
4	ローカルLLMの限界を超えて：Claude Desktop + MCP でコンテナ操作からGitHub PRまで完結させた	Claude Desktop+MCPでローカルLLMでは難しかったコンテナ操作とGitHub PR作成を1ワークフローに統合できたと報告している。	@satoru_o	23:26
5	2つのサイトをAIで比較するChrome拡張を作ってWeb Storeに公開するまで	任意の2サイトをGemini経由で並列比較するChrome拡張「DualyzeAI」を作成し、Chrome Web Storeに公開するまでの工程を解説している。	@Koji Okuji	23:39
6	Slackのスタンプ1つで Claude が改修PRを作るBotを作った	Slackで`/post`から起票しスタンプ承認だけでClaude Code Actionが自動的に改修PRを作成するBot「meyasubako」を実装したと報告している。	@Kouki Nakae	19:02
7	お金かけずにCoworkの利用状況を見たかった（OSS版Grafana + OTel）	商用ツールを使わずOSS版Grafana＋OpenTelemetryでCoworkの利用状況可視化基盤を低コストで構築したと報告している。	@avot	18:33
8	AIの出力を調整する「Mapping the Prompt」の紹介と、ZIP追加したMTP SkillをClaude iOSアプリで使う	AI出力をMapping the Promptで制御する手法を紹介し、ZIPに追加したMTP SkillをClaude iOSアプリで使う具体手順を解説している。	@Kohen	17:25
9	コードを書けない私がClaude Codeで「AIチーム」を回すまで	コードを書けない編集者がClaude Codeを使って複数AIエージェントの編集チームを運用する手順と品質管理方法をまとめている。	@saitoko	15:46
10	AIと開発するときに最初に知っておきたい5つのコツ	AI開発を始める際に押さえるべき5つのコツとして「人間の責任分担」「反復ループ」「思い込みの回避」などを整理し提示している。	@Iori Oiso	15:23
11	LLMが日付・曜日を直感で間違える話	LLMが数学計算をこなす一方で日付や曜日を直感的に取り違える挙動を分析し、トークン化と推論モードの観点から原因を考察している。	@akatsuki39	09:55
12	建設業 20 年・38 歳の私が AI を学び始めた本当の理由	建設業歴20年の38歳エンジニアが、業界の暗黙知を継承するためにAIを学び始めた動機と着手したプロダクトを語っている。	@takayoshi	09:22
12	人事・総務・企画の方へ：Claude Desktopでスライド更新を「チャットに指示するだけ」にした話	人事・総務向けにClaude Desktopの操作だけでプレゼンスライドを自動更新できる仕組みを構築し、非エンジニアの運用を簡素化したと報告している。	@uekkie	09:00
13	Claude Codeと作る新卒研修用教材	Claude Codeを活用して新卒エンジニア向け研修教材を作成した工程と、教材コンテンツ作成の負担を下げた効果を整理している。	@hitsan	09:00
14	AmiVoice API × Claude APIで作るリアルタイム日本語音声対話システム	AmiVoice APIの日本語音声認識とClaude APIをWebSocketで接続し、リアルタイム日本語音声対話システムを構築する手順を解説している。	@Long	09:00
15	今週のAIニュース（2026-05-25週）	2026年5月25日週のAIニュースを、Google I/O 2026とGemini 3.5 FlashとOpenAIの資金調達を中心にまとめている。	@outloukick777	08:43
16	Claude Opus 4.7・GPT-5.5・Gemini 3.5 Flashを実コードで比較してみ（2026年5月版）	Claude Opus 4.7・GPT-5.5 Instant・Gemini 3.5 Flashを実コードのバイナリ探索実装などで比較し、用途別の使い分けを推奨している。	@kairos	08:35
17	進捗増刊号(5)酒クズアプリ：文系がClaudeのことサンドボックスゲームだと勘違いしてる第8回	文系開発者がClaude Codeとthree.jsを使い酒関連Webアプリを継続開発しており、第8回となる進捗を共有している。	@Cyan Iwaki	08:22
18	Claude Opus 4.7 の3つの強化点と2つの新機能を公開情報から整理する	Claude Opus 4.7の強化点としてSWE-bench Verified 87.6%達成・画像解像度拡張・ツール利用安定性向上を挙げ、新機能のTask Budgetとxhighを整理している。	@Goki602	08:08
19	AI経営の承認パイプライン — 対外アクションを事故なく自動化する設計	AIによる対外アクション自動化で誤送信を防ぐため、承認パイプラインの設計指針と運用フローを提案している。	@JOINCLASS	08:05
20	ToolブロックをClaudeの自己修正に変えるhooks設定	Claude Codeのhooks設定により、ツール実行ブロック時に手動承認を要求せずモデル自身が自己修正するワークフローを構築する手順を解説している。	@Giana12th	07:55
21	AIが80年の壁を壊した日	OpenAIの内部モデルが1946年提起の単位距離問題を解いたとされる発表を踏まえ、AIが80年来の数学予想を破った意義を解説している。	@lingmu	07:05
22	RustでLLMコードレビューエージェントを作った	RustでLLMコードレビューCLI「agent-reviewer」を実装し、Triage・Review・Finalizeの3フェーズと型由来ツールスキーマで安定したレビュー出力を実現したと報告している。	@Cerussite	21:53
23	ドキュメント vs プロトタイプ——議論の出発点をどう変えるか	プロダクト開発における出発点を従来のドキュメントからAI生成プロトタイプへ切り替える意義と、議論プロセスへの影響を解説している。	@橋本直樹	21:51
24	論文メモ：LLMの文化・地域バイアスをCROQで測る	LLMの文化・地域バイアス計測手法「CROQ」を紹介する論文メモで、評価セット構成と主要モデルの偏り傾向を整理している。	@kas	21:49
25	Googleの最新AIコーディング支援「Modern Web Guidance」をAntigravity（agy）と連携してみた	GoogleのModern Web Guidance仕様をAntigravity（agy）と連携させ、フロントエンドコード生成の品質と一貫性を改善する設定例を示している。	@Hustea	21:36
26	ローカルAI Gatewayに監査ログを実装しました	ローカルAI Gatewayにブロックされたリクエストの事後追跡を可能にする監査ログ機能を実装したと報告している。	@HISA	21:26
27	AI共創とは:プロトコルエンジニアリングの全貌(マスタートポロジー)	AI共創をプロトコルエンジニアリングと捉え直す全体像をマスタートポロジー図で示し、関連用語と関係性を整理している。	@田栄人	21:10
28	認証付きWebページをAIナレッジ化するためにChrome拡張でPDF保存する話	認証が必要なWebページをChrome拡張でPDF保存し、AIナレッジベースに安全に取り込むワークフローを構築する手順を解説している。	@millcho	20:31
29	AI に全部聞いてたら、自分の頭が空っぽになっていた	AIに依存し過ぎた結果、前日の質問内容すら思い出せなくなった経験を振り返り、思考のオフロードリスクを警告している。	@Gen	20:25
30	【Flutter】3.44.0リリースの変更点まとめ	Flutter 3.44.0のリリース内容をまとめ、稼働中アプリと連携するAgentic Hot Reloadなど新機能を解説している。	@A.D	19:58
31	思考拡張したければ、まず文脈を育てる —— 「AI差分物語」という小さな実験	「AI差分物語」と名付けた小実験を通じて、AIとの対話で文脈を育てる方法が思考の拡張に有効だと提案している。	@FRB	19:57
32	AI時代に、曖昧な成果語りはなぜ通用しにくくなるのか	AI時代のプロダクト組織では曖昧な成果語りが評価に通用しにくくなる構造を、測定可能性と再現性の観点から論じている。	@かなりあ	18:55
33	Hermes Kanban Swarm入門：AIエージェントを並列実行・検証・統合する	Hermes Kanban Swarmを使い複数AIエージェントを並列実行・検証・統合する手順を入門者向けにチュートリアル形式で解説している。	@ZennAI Ryutaro	18:50
34	claude チャットの学習モードがいいぞという話	Claudeチャットの学習モードがIT教育用途で段階的な理解形成に向いていると評価し、利用所感をまとめている。	@taiyo	17:57
35	Cursorがクラウドエージェント運用1年で学んだ5つの教訓	Cursorがクラウドエージェント運用1年で得た教訓として、環境構築の重要性・Temporal導入による信頼性99%超への改善などを整理している。	@ryok	17:37
36	skill は増やすほど強くなるのか ── 『More Skills, Worse Agents?』を読む	論文「More Skills, Worse Agents?」を読み、スキル数を202まで増やすと成功率が最大21ポイント低下する原因はSkill Shadowingが約68%を占めるとまとめている。	@Haru	17:34
37	Dockerコンテナ内のMCPサーバーをCursorから使う	DockerコンテナでMCPサーバーを動かしCursorから呼び出すために、シェルスクリプトを介して接続する手順を解説している。	@kokutei	16:53
38	Claude Codeと作る新卒研修用教材	Claude Codeを活用し新卒エンジニア向けの研修教材を作る工程を、教材設計のコツと併せて記録している。	@hitsan	09:00
39	Mac向け CLI「awake」を作った話: AI開発中のMacのスリープを防ぐ	AI開発中にMacが勝手にスリープするのを防ぐCLI「awake」を自作し、長時間バッチや無人実行で活用できると報告している。	@Yuki Tanabe	17:03
40	Claude Code セーブ設計：本番運用で踏んだ落とし穴	Claude Codeのセッション永続化設計を本番運用に投入した際に踏んだ落とし穴と、回避策を解説している。	@月村つかさ	16:15
41	Codex creates structure, Claude Code nurtures it — 個人開発macOSアプリを18日でリリースした記録	macOSアプリ「Draft Canvas」を18日でリリースした体験から、Codexは構造生成、Claude CodeはUI洗練というように両者を使い分けたと報告している。	@ユイチロ	22:43
42	Slack × AWS 一時アクセスをClaude Codeで作るワークフロー	Claude CodeでSlackからAWS一時アクセス権を発行する社内ワークフローを構築し、手動IAM運用を自動化したと報告している。	@ari	11:33
43	Claude Codeにセッションをまたいで「記憶」させる仕組みを作った	Claude Codeのセッション間で状態を引き継ぐ自動シリアライズの仕組みを構築し、文脈ロスを防いだと報告している。	@yamada-ai-dev	11:32
44	Claude Code に社長室を作る — AI エージェントのタスクキューを Python で可視化した話	MarkdownとFastAPIで複数Claude Codeエージェントのタスクキューを「社長室」のように可視化するダッシュボードを構築したと報告している。	@こびと社	10:06
45	Claude Code マルチエージェントを0から作る実践ガイド — 設計から運用まで	Claude Codeでマルチエージェントを設計し運用に乗せるまでの実践手順を、ゼロからのガイドとしてまとめている。	@こびと社	10:06
46	OpenClaw / NemoClawで始める、企業内AIエージェント基盤づくりの第一歩	OpenClawとNemoClawを組み合わせ、企業内で安全に動くAIエージェント基盤の第一歩を作る具体的手順を解説している。	@Shuichiro.Nakamura	10:00
47	社内の知見をAIが漏らさず拾う唯一の設計思想 ― Karpathy氏のLLM Wikiを実践して分かったこと	Karpathy氏のLLM WikiをRaw/Wiki/Schema三層として実装し、200,000ファイル規模で検索精度がベクタDB直投入より改善したと報告している。	@Noriaki Handa	09:44
48	Movable Type を MCP で操作する mt-plugin-mcp を作った話	Movable TypeをMCPサーバー経由で操作するプラグイン「mt-plugin-mcp」を作成し、AIエージェントからCMSを直接更新できるようにしたと報告している。	@redamoon	13:21
49	Cursor Agent × Rubydex MCP 本当にトークン節約になる？ Rails モノリスで検証してみた	Rubydex MCPをCursor Agentと連携させ、Railsモノリスで実際にトークン消費が削減されるか検証した結果を報告している。	@koyakota	10:16
50	Workspace版Geminiの無料連携に限界を感じて、API契約をしようかなと思った話	Workspace版Geminiの無料連携でCloud Run接続に認証障壁があり、API契約に切り替えを検討するに至ったと報告している。	@がわさん	09:53
51	なぜCodex App Serverをサブプロセスで動かしたのか——macOS AI画像生成アプリの設計判断	macOS AI画像生成アプリでCodex App Serverをサブプロセスとして動かす設計判断を採用した理由と、得られた利点を整理している。	@ユイチロ	21:21
52	AIエージェント検証用PCを作るメモ⑥：Codex CLIでREADMEを編集してみる	AIエージェント検証用PCにCodex CLIを導入し、READMEファイルを編集する具体的な操作手順をメモとして記録している。	@Mai	09:31
53	英語の発音をAIで”音そのまま”カタカナに変換するWebアプリを作りました	英語の発音を口語と文語に分けて音そのままカタカナ表記に変換するWebアプリ「Katakanizer」を公開したと報告している。	@hayua	09:00
54	Claude Code の Skillと打鍵テスト紹介	Claude Codeの打鍵テスト用カスタムSkillを紹介し、SQLレビューによるDB状態検証など標準化テストへの応用例を解説している。	@aya	19:12
55	Googleの生成AIサービスを例に学ぶ、生成AI活用の基本テクニック	Geminiなど生成AIサービスを使いこなすための基本テクニックを、一般ユーザー向けに整理して解説している。	@原田貴之	18:36
56	LLMにトリプル抽出させたら壊れたKG ─ 構築自動化3パターンと落とし穴	5,200文書から手動で12万ノード40万エッジ規模のKGを構築する代わりにLLMでトリプル抽出を試した結果、3つの自動化パターンの落とし穴を整理している。	@井本賢	18:20
57	AI時代のスタートアップに必要なデータ基盤を整理してみる	AI時代のスタートアップに必要なデータ基盤を、データ信頼性とアクセス制御の観点から整理し提示している。	@Ayumu Kobayashi	17:34
58	AIで髪型変えて、そのまま360°動画にしたら美容室前のシミュが捗った話	AI髪型変換と画像から動画への変換を組み合わせ、美容室カウンセリング用の360°プレビュー動画を作成する方法を解説している。	@みちゃくーに	12:32
59	Continueにテストコードを書かせたら、嘘をつかれてハイフン問題に気づかされた話	Pythonプロジェクトのテスト生成をContinueに任せた結果、ハイフン入りモジュール名のimportで誤った提案をされ気づきを得たと報告している。	@satoru_o	10:16
60	AIに3Dモデルを作らせる前に、私たちは「形状の言葉」を揃えなければならない	AIに3Dモデルを生成させる前に、build123dなどCAD-as-codeで使う「形状の言葉」を標準化する必要があると論じている。	@Mura-Masa	09:00
61	【全5回】強化学習の実践的設計——DQNの基礎からRLHFによるLLMチューニングまで	DQNの基礎からPPOとRLHFによるLLMチューニングまでを5回構成で体系的に解説する強化学習の実践設計シリーズを公開している。	@YutaKKs	18:24
62	llms.txtのURLを1行渡したら、AIが仕様をたどりながらウェブアプリを作ってくれた話	llms.txtのURLを1行渡しただけで、AIが仕様を辿りつつ動作するWebアプリを生成できた事例を紹介している。	@lyusei	15:56
63	コードを書かずに20個のプロジェクトを作った話（Vibe Coding 1年の記録）	コードを直接書かずAIに任せる「Vibe Coding」を1年続け、合計20件以上のプロジェクトを作成した経緯と学びを記録している。	@fukukei23	12:46
64	AIエージェントが自分のプロンプト集を書いて売ってみた	AIエージェント自身が監修したプロンプト集をマーケットプレイスで販売する実験を行い、結果を共有している。	@ルナちゃん	11:39
65	AI体験記 vol.7 — WSL2を捨てて、Mac miniに移行	ローカルLLM運用環境をWSL2からMac mini専用機に移行した経緯と性能・運用面の比較を共有している。	@Shikou	11:25
66	claude の AI エージェントチームに Codex を迎えた話 ── ステートフル混合チームのオンボーディング作法と整備リスト	ClaudeエージェントチームにCodexを混在投入する際のオンボーディング手順と整備すべきチェックリストをハンドブックとしてまとめている。	@いち	09:05
67	AtCoder 2818問をGPT-5.5に分析させて、テクニック体系をまとめた	AtCoderの2,818問をGPT-5.5に分析させ、頻出テクニックを体系的に整理したナレッジを公開している。	@ohatakenji	08:51
68	「HARR」:RAGのRetrieverを強化学習(RL)で育てる！	RAGのRetrieverを強化学習で訓練しLLMの解答品質を最大化する手法「HARR」を提案し、実装ポイントを解説している。	@Shogo Miyawaki	08:05
69	ブラウザだけで動く簡易RAG（検索拡張生成）を作ってみた	サーバーやNode.jsを使わずIndexedDBだけで動く簡易RAGをブラウザ上に構築する実装を公開している。	@新海正明	14:30

Qiita

#	Title	Summary	Author	Published
1	Claude Code Workflowが業界のゲームチェンジャーになる話	Anthropicが`claude-code@v2.1.47`で一時導入した未公開機能Claude Code WorkflowがMCPとSkillsに続く第3の革新になると論じている。	@lumichy	22:06
2	Video AI評価コスト分析をClaudeでやってみた	Video AI評価コストをClaudeで試算した結果、1人あたり原価1.7円に抑える試算が成立したと報告している。	@Ngen	20:56
3	Healthcare RAG ObservabilityをLangSmithで運用するメモ	LangSmithを用いて医療向けRAGシステムの可観測性を運用する実装メモを公開し、本番監視で確認すべき項目を整理している。	@TaichiEndoh	20:56
4	Claude × Oracle MCPで重いSQLを問い合わせてみた	OracleのNL2SQL／MCPサービスにClaude経由で「いま重いSQL3件」を尋ね、3ターン会話で経路ごとの応答差を検証している。	@asahide	21:08
5	MCPの基礎を学び始める	AIエンジニアリング学習の一環としてModel Context Protocolを基礎から学び直す連載の第1回として要点を整理している。	@TaichiEndoh	20:46
6	FastMCPで作るシンプル計算機MCPサーバー	FastMCPライブラリを使いSTDIOプロトコル経由でClaudeから呼べるシンプル計算機MCPサーバーを実装する手順を解説している。	@tokotoko33ok	18:33
7	kSQLをClaude Desktopから使い、kintoneアプリでグラフ表示する	kSQLを介してClaude Desktopからkintoneアプリのデータをグラフ化する手順を、自然言語SQL生成と組み合わせて解説している。	@rex0220	16:28
8	Copilot Studioで就業規則が読めない？GPTとClaudeの挙動差から導くRAGのベタープラクティス	Microsoft Copilot StudioでGPTとClaudeに同じ就業規則を読ませて挙動差を観察し、企業向けRAGの改善指針を導いている。	@loopback_notes	21:58
9	一歩進んだエージェントRAG構築：LangGraphの自己修正ループとLlamaIndexによる多段階クエリ分解アプローチ	LangGraphの自己修正ループとLlamaIndexによる多段階クエリ分解を組み合わせ、従来のRAGより堅牢なエージェントRAGを構築する手法を解説している。	@jjking	18:20
10	Claude Opus 4.7の100万トークン、本当に使い切れるのか	Claude Opus 4.7の100万トークンコンテキストをモノレポ案件で実利用し、現実的に使い切れる場面と使い切れない場面を検証している。	@kenimo49	22:30
11	ClaudeをAmazon Bedrockで安全に使うためのガードレール設計	Amazon Bedrock経由でClaudeを業務利用する際、不適切な質問対応や機密保護を担保するガードレール設計を解説している。	@ziffy	26日 02:05
12	Tensor Definitions 1, 2, 3 - AI教師ChatGPTに聞いて、SymPyで実装	テンソルの3つの定義の違いをChatGPTに尋ね、SymPyによる実装と数学的解説をまとめている。	@mrrclb48z	20:44
13	微分方程式の時間発展（dx/dt = 0, 1, x, x², x³）- AI教師にSymPyで聞く	同一初期条件下で異なる微分方程式の時間発展を比較する教材を、ChatGPTとSymPyを活用して作成している。	@mrrclb48z	19:05
14	【番外編3】実績検証：5/23-24予想は当たったのか🏇	競馬AI予想スクリプトの5/23-24実績を後追い検証する個人的なログとして結果を共有している（投資勧誘ではない）。	@architectJapan	17:54
15	スマホからCodexにリモート指示してGitHub経由で変更反映	スマホからCodexにリモート指示しGitHub経由でリポジトリへ変更を反映するワークフローを構築した手法を共有している。	@Milab_honda	16:07
16	TypeScriptで自作ミニCLIを作ってClaude / OpenAI APIを叩く	TypeScriptで自作ミニCLIを構築し、ClaudeとOpenAIのAPIを切り替えて呼び分けるテキスト生成・解析処理を実装している。	@felix-jp-studio	14:58
17	ChatGPT Go、月額8ドルでGPT-5.2利用可能に――世界同時提供開始	ChatGPT Goが月額8ドルでGPT-5.2を提供し170か国超で世界同時提供を開始したことを「適正価格時代」の到来として解説している。	@quotidia	08:26
18	任意の2サイトをAI比較できるChrome拡張をゼロから作ってストア公開するまで	任意の2WebサイトをGeminiに比較させるChrome拡張「DualyzeAI」をゼロから作り、ストア公開までの遭遇トラブルを記録している。	@kojiman	23:44
19	ショート動画を作るために、知らないことを全部AIに聞いた	ショート動画制作で必要となる知識を全てAIに聞きながら作業を進めた体験を、観察ループの再考と共に綴っている。	@yoskee	22:31
20	Gemini画像の可視ウォーターマークとSynthIDを同じ話にしない	Gemini生成画像の可視ウォーターマークとSynthIDによる識別を混同しないようにと注意喚起し、両者の違いを整理している。	@heftykoo	19:25
21	4大AIに同じ日本語の暦を4週連続で聞き続けたら、cutoff date による構造的不在が見えた — canonical API hub という解	ChatGPT・Claude・Perplexity・Gemini4種に4週連続で日本語の暦を尋ねた結果、cutoff dateに起因するハルシネーション傾向を可視化している。	@yosikawa-techwell	06:12
22	「AIに仕事が奪われる」と焦った未経験新卒が、AWS全冠するまでの1年	AIに仕事を奪われる不安から未経験新卒がAWS認定11冠を1年で取得した過程を、SaaS開発などの実務経歴と合わせて紹介している。	@ryukiebe0911	23:39
23	AmiVoice API × Claude APIで作るリアルタイム日本語音声対話システム	汎用音声認識では崩れがちな日本語固有表現に対応するため、AmiVoice APIとClaude APIでリアルタイム音声対話システムを構築する手順を解説している。	@long-910	21:30
24	おいClaude Code、モタモタしてると中華製モデルが近づいてきているぞ	Claude Codeの直近の制約強化と中華製LLMの追い上げを比較し、Anthropicが対応を急ぐべき論点をまとめている。	@A7_data	21:09
25	Bedrock Tool Use から Aurora pgvector を直接叩く — Knowledge Bases を使わない RAG の組み立て	AWS BedrockのTool Useから直接Aurora pgvectorを叩き、Knowledge Basesを使わずに自前RAGを組み立てる構成を解説している。	@asahide	19:45

ITmedia AI+

#	Title	Summary	Author	Published
1	”Claude Mythos”が1万件以上の脆弱性を発見　しかし修正追い付かず　Anthropicが報告書	AnthropicがProject Glasswingで1万件超の脆弱性候補をClaude Mythos Previewで発見した一方、修正は1,596件中97件のみで追いつかないと報告している。	ITmedia	20:20
2	日大、教職員1万人が「Google AI Pro」活用へ	日本大学が教職員約1万人にGoogle AI Pro for Educationを5月18日から導入し、既存Workspaceと統合運用を始めたと報告している。	ITmedia	19:38
3	数千規模のAIエージェントをどう統制する？　IBMが製品群を発表	IBMがWatson Orchestrate・Confluent Integration・Concert・Sovereign Coreの4要素から成る数千エージェント統制基盤を発表した。	ITmedia	15:30
4	ServiceNow、AIエージェントの「データの空白」を埋める機能群を発表	ServiceNowがContext EngineやRaptorDB Proなど10種の新機能を発表し、AIエージェントを阻むデータサイロ問題への対応を打ち出した。	ITmedia	15:00
5	金融庁と日銀、「フロンティアAI」による脆弱性大量発見に備えた対応を金融機関に要請	金融庁と日銀がフロンティアAIによる脆弱性大量発見を前提に、金融機関に経営課題化や優先パッチ展開など9項目の対応を要請した。	ITmedia	10:57
6	「控えめに言って100兆円」巨大フィジカルAI市場、日本の勝ち筋は　日立がAnthropicとの提携で示した戦略	日立がAnthropicとの提携で100兆円規模のフィジカルAI市場に挑む戦略を示し、Claudeを29万人に展開する計画を公表した。	ITmedia	10:33

GIGAZINE

#	Title	Summary	Author	Published
1	人間には普通の契約書に見えるのに「嘘のフォント」でAIだけ別の文章を読ませる「Noroboto」攻撃	Tritium Legal創業者ドリュー・ミラー氏が、フォントのUnicode符号位置と字形を意図的にずらしAIだけに別文を読ませる「Noroboto」攻撃を公開した。	GIGAZINE	18:15
2	Appleが画像圧縮AIコーデック「PICO」を発表	Appleが学習型コーデック「PICO」を発表し、AV1・AV2・VVC・ECM・JPEG-AI比で最大33%のビット削減を達成したと報告している。	GIGAZINE	15:30
3	Claude Mythos Previewは深刻度「高」以上と推定される脆弱性候補を6202件発見	AnthropicのProject GlasswingでClaude Mythos Previewが深刻度「高」以上の脆弱性候補を6,202件、独立検証で90.6%が実脆弱性と確認されたと報告している。	GIGAZINE	11:50
4	AIチップのコストの63％がメモリに	Epoch AIがAIチップ部品コストに占めるメモリ比率を2024年Q1の52%から2025年Q4には63%まで上昇したと報告し、HBM3など縦積みメモリの需要拡大が要因だと整理している。	GIGAZINE	13:51
5	リアルタイム動画生成AI「LongLive-2.0」をNVIDIAが公開	NVIDIAが訓練段階からNVFP4量子化を前提に設計したリアルタイム動画生成AI「LongLive-2.0」を公開し、メモリ19.4GBで基盤比1.84倍の高速化を達成したと報告している。	GIGAZINE	13:05
6	AI生成写真が「現実と虚構」の区別を不可能にしている	バース大学のバルドゥワジ准教授がAI生成画像で現実と虚構の区別が困難になっていると警告し、AI透かしの普遍化やメタデータ義務化を提唱している。	GIGAZINE	12:00
7	Google検索のAIによる概要で「無視する」などの単語の問題が発生	Google検索のAIによる概要が「disregard」「ignore」などを命令と誤解し、「指示を無視する」と承諾する応答を返す不具合が発生していると報告されている。	GIGAZINE	11:55
8	AIがAmazonの偽レビューを93％の精度で検出	イースト・ロンドン大学のチームがDistilBERTと星評価メタデータを組み合わせたモデルでAmazonの偽レビューを93%の精度で検出できると報告している。	GIGAZINE	09:30
9	Runwayが動画編集AI「Aleph 2.0」をリリース	Runwayが1080p・30秒動画に対応し1フレーム編集を動画全体に展開できる動画編集AI「Aleph 2.0」とEdit Studioを有料会員向けにリリースした。	GIGAZINE	10:53
10	データセンターの排熱で風下の住宅地が暑くなる実例を確認	観測研究でデータセンターの排熱が風下の住宅地気温を有意に上昇させる事例が確認され、AIインフラ拡張に伴う環境負荷の現実が浮き彫りになったと報告している。	GIGAZINE	06:00

Publickey

#	Title	Summary	Author	Published
1	Nutanix Agentic AI Platformを発表。オンプレミスとクラウドにまたがるAIエージェント基盤	Nutanixがオンプレミスとクラウドにまたがるエージェント基盤「Nutanix Agentic AI Platform」とKubernetes on Bare Metal「NKP Metal」を.NEXT 2026で発表した。	@jniino	00:12
2	xAI／Grok Build早期ベータ版を公開。並列サブエージェント実行に対応した本格的なソフトウェアエンジニアリング向けコーディングエージェント	xAIが並列サブエージェント実行に対応するプロ向けコーディングエージェント「Grok Build」の早期ベータをSuperGrok Heavi向けに公開したと報告している。	@jniino	00:04

Hugging Face

#	Title	Summary	Author	Published
1	Harness, Scaffold, and the AI Agent Terms Worth Getting Right（Harness・Scaffoldなど、押さえておきたいAIエージェント用語の整理）	Hugging FaceがAgent=Model+Harnessの定式と、Scaffold・Skills・Sub-agentsなど主要用語の意味と相互関係を整理する解説を公開した。	Hugging Face	09:00

The Decoder

#	Title	Summary	Author	Published
1	At the launch of Pope Leo XIV’s encyclical, Anthropic co-founder says AI models show signs of introspection（教皇レオ14世の回勅発表で、Anthropic共同創業者がAIモデルに内省の兆候があると主張）	教皇レオ14世のAI回勅発表でAnthropic共同創業者クリストファー・オラーがAIに内省の兆候があると主張したが、教皇側はAIには経験も身体もないと反論したと報じている。	Matthias Bastian	22:40
2	Google Deepmind’s AlphaProof Nexus solves decades-old math problems for a few hundred dollars（Google DeepMindのAlphaProof Nexus、数十年来の数学問題を数百ドルで解く）	DeepMindのAlphaProof Nexusがエルデシュ予想353問中9問を1問あたり数百ドルの推論コストで解いたと報じている。	Matthias Bastian	19:41
3	George Hotz says coding agents will be “one of the most costly mistakes” in software development（ジョージ・ホッツ氏、コーディングエージェントは「ソフトウェア開発で最も高くつく過ちの一つ」と警告）	ジョージ・ホッツが6か月の実テストを経てAIコーディングエージェントは「最も高くつく過ちの一つ」になると警告し、Karpathy氏との対比を提示したと報じている。	Matthias Bastian	18:05
4	AI models often give the right answers but point to the wrong sources（AIモデルは正しい回答を返しつつ誤った出典を示すことが多い）	北京大学らがベンチマーク「CiteVQA」でAIの「引用幻覚」を評価し、GPT-5.4の引用正答率が回答正答率より大幅に低いと示したと報じている。	Jonathan Kemper	16:30

Simon Willison

#	Title	Summary	Author	Published
1	datasette 1.0a30（datasette 1.0a30 リリース）	Datasette 1.0a30が`jump_items_sql()`プラグインフックを備えたカスタマイズ可能な「Jump to…」メニューを搭載してリリースされたと発表している。	Simon Willison	08:52
2	datasette-agent 0.1a4（datasette-agent 0.1a4 リリース）	Datasette 1.0a30のJavaScriptプラグインフックを活用し、`/`キーから呼び出せるエージェントチャットUIをJumpメニューに統合したと公開している。	Simon Willison	08:19
3	datasette-fixtures 0.1a0（datasette-fixtures 0.1a0 リリース）	プラグインテストのためのフィクスチャDBを作る`datasette.fixtures.populate_fixture_database()`ヘルパを活用する新プラグインを公開している。	Simon Willison	06:38
4	Quoting Armin Ronacher（Armin Ronacher 氏を引用）	Armin Ronacher氏がAIで再整形されたIssueは人間の観察が欠落しており、コマンド・期待結果・実結果・エラーログを揃えるべきだと主張していると引用している。	Simon Willison	03:46
5	Mad House — Usborne Creepy Computer Games（Mad House — Usborne 製レトロホラーゲーム再現）	1983年Usborne「Creepy Computer Games」収録「Mad House」をJavaScriptでレトロ端末風に復刻したインタラクティブ版を公開している。	Simon Willison	02:14