VOL. 029
AI NEWS DIGEST
AI OUTLINE
2026-05-25
月曜日 · JST
TODAY’S ISSUE 2026年5月25日 · 月曜日 AI FRONTLINE

AI News Digest: 2026-05-25

Top 20

人間には普通の契約書に見えるのに「嘘のフォント」でAIだけ別の文章を読ませる「Noroboto」攻撃

Source: GIGAZINE | Published: 2026-05-25 18:15 JST

Appleが画像圧縮AIコーデック「PICO」を発表

Source: GIGAZINE | Published: 2026-05-25 15:30 JST

Claude Mythos Previewは深刻度「高」以上と推定される脆弱性候補を6202件発見

Source: GIGAZINE | Published: 2026-05-25 11:50 JST

“Claude Mythos”が1万件以上の脆弱性を発見 しかし修正追い付かず Anthropicが報告書

Source: ITmedia AI+ | Published: 2026-05-25 20:20 JST

Google Deepmind’s AlphaProof Nexus solves decades-old math problems for a few hundred dollars(Google DeepMindのAlphaProof Nexus、数十年来の数学問題を数百ドルで解く)

Source: The Decoder | Published: 2026-05-25 19:41 JST

At the launch of Pope Leo XIV’s encyclical, Anthropic co-founder says AI models show signs of introspection(教皇レオ14世の回勅発表で、Anthropic共同創業者がAIモデルに内省の兆候があると主張)

Source: The Decoder | Published: 2026-05-25 22:40 JST

AIチップのコストの63%がメモリに

Source: GIGAZINE | Published: 2026-05-25 13:51 JST

リアルタイム動画生成AI「LongLive-2.0」をNVIDIAが公開

Source: GIGAZINE | Published: 2026-05-25 13:05 JST

“Cursor”開発の新モデル、コスト1/10で最先端モデル並み性能 第三者機関が評価

Source: ITmedia AI+ | Published: 2026-05-25 07:13 JST

George Hotz says coding agents will be “one of the most costly mistakes” in software development(ジョージ・ホッツ氏、コーディングエージェントは「ソフトウェア開発で最も高くつく過ちの一つ」になると警告)

Source: The Decoder | Published: 2026-05-25 18:05 JST

AI models often give the right answers but point to the wrong sources(AIモデルは正しい回答を返しつつ誤った出典を示すことが多い)

Source: The Decoder | Published: 2026-05-25 16:30 JST

日大、教職員1万人が「Google AI Pro」活用へ

Source: ITmedia AI+ | Published: 2026-05-25 19:38 JST

「控えめに言って100兆円」巨大フィジカルAI市場、日本の勝ち筋は 日立がAnthropicとの提携で示した戦略

Source: ITmedia AI+ | Published: 2026-05-25 10:33 JST

金融庁と日銀、「フロンティアAI」による脆弱性大量発見に備えた対応を金融機関に要請

Source: ITmedia AI+ | Published: 2026-05-25 10:57 JST

数千規模のAIエージェントをどう統制する? IBMが製品群を発表

Source: ITmedia AI+ | Published: 2026-05-25 15:30 JST

ServiceNow、AIエージェントの「データの空白」を埋める機能群を発表

Source: ITmedia AI+ | Published: 2026-05-25 15:00 JST

xAI/Grok Build早期ベータ版を公開。並列サブエージェント実行に対応した本格的なソフトウェアエンジニアリング向けコーディングエージェント

Source: Publickey | Published: 2026-05-26 00:04 JST

Nutanix Agentic AI Platformを発表。オンプレミスとクラウドにまたがるAIエージェント基盤、Kubernetes on Bare Metalも

Source: Publickey | Published: 2026-05-26 00:12 JST

Harness, Scaffold, and the AI Agent Terms Worth Getting Right(Harness、Scaffoldなど、押さえておきたいAIエージェント用語の整理)

Source: Hugging Face | Published: 2026-05-25 09:00 JST

MCPとSkillsに続く第3の革命:Claude Code WorkflowがultraworkでAgentをコードに焼き付ける

Source: Zenn | Published: 2026-05-25 22:06 JST


All Articles

Zenn

#TitleSummaryAuthorPublished
1Claudeに小説の矛盾を秒で見つけさせる:Obsidian × MCP で作る『Lore Keeper』Obsidianのキャラ・世界観・年表ノートを参照し小説本文の矛盾をClaude経由で検出するBYOK型MCPサーバー「Lore Keeper」を公開した。@saruhatsu22:49
2Claudeと一緒に「倍増配株」を探し始めた話📈投資家がIR資料をClaudeで分析し配当が急増している銘柄を探す試みを始めたと報告している。@レイン│Claude×投資ラボ22:14
3【AI学習法】CSSをClaudeに聞きながら学んだら、「なぜそう書くか」から理解できた話【CSS編】CSSの記法そのものではなく「なぜそう書くか」をClaudeに尋ねながら学ぶ方法が、初学者にとって構造的理解に有効だったと報告している。@Nana22:06
4ローカルLLMの限界を超えて:Claude Desktop + MCP でコンテナ操作からGitHub PRまで完結させたClaude Desktop+MCPでローカルLLMでは難しかったコンテナ操作とGitHub PR作成を1ワークフローに統合できたと報告している。@satoru_o23:26
52つのサイトをAIで比較するChrome拡張を作ってWeb Storeに公開するまで任意の2サイトをGemini経由で並列比較するChrome拡張「DualyzeAI」を作成し、Chrome Web Storeに公開するまでの工程を解説している。@Koji Okuji23:39
6Slackのスタンプ1つで Claude が改修PRを作るBotを作ったSlackで/postから起票しスタンプ承認だけでClaude Code Actionが自動的に改修PRを作成するBot「meyasubako」を実装したと報告している。@Kouki Nakae19:02
7お金かけずにCoworkの利用状況を見たかった(OSS版Grafana + OTel)商用ツールを使わずOSS版Grafana+OpenTelemetryでCoworkの利用状況可視化基盤を低コストで構築したと報告している。@avot18:33
8AIの出力を調整する「Mapping the Prompt」の紹介と、ZIP追加したMTP SkillをClaude iOSアプリで使うAI出力をMapping the Promptで制御する手法を紹介し、ZIPに追加したMTP SkillをClaude iOSアプリで使う具体手順を解説している。@Kohen17:25
9コードを書けない私がClaude Codeで「AIチーム」を回すまでコードを書けない編集者がClaude Codeを使って複数AIエージェントの編集チームを運用する手順と品質管理方法をまとめている。@saitoko15:46
10AIと開発するときに最初に知っておきたい5つのコツAI開発を始める際に押さえるべき5つのコツとして「人間の責任分担」「反復ループ」「思い込みの回避」などを整理し提示している。@Iori Oiso15:23
11LLMが日付・曜日を直感で間違える話LLMが数学計算をこなす一方で日付や曜日を直感的に取り違える挙動を分析し、トークン化と推論モードの観点から原因を考察している。@akatsuki3909:55
12建設業 20 年・38 歳の私が AI を学び始めた本当の理由建設業歴20年の38歳エンジニアが、業界の暗黙知を継承するためにAIを学び始めた動機と着手したプロダクトを語っている。@takayoshi09:22
12人事・総務・企画の方へ:Claude Desktopでスライド更新を「チャットに指示するだけ」にした話人事・総務向けにClaude Desktopの操作だけでプレゼンスライドを自動更新できる仕組みを構築し、非エンジニアの運用を簡素化したと報告している。@uekkie09:00
13Claude Codeと作る新卒研修用教材Claude Codeを活用して新卒エンジニア向け研修教材を作成した工程と、教材コンテンツ作成の負担を下げた効果を整理している。@hitsan09:00
14AmiVoice API × Claude APIで作るリアルタイム日本語音声対話システムAmiVoice APIの日本語音声認識とClaude APIをWebSocketで接続し、リアルタイム日本語音声対話システムを構築する手順を解説している。@Long09:00
15今週のAIニュース(2026-05-25週)2026年5月25日週のAIニュースを、Google I/O 2026とGemini 3.5 FlashとOpenAIの資金調達を中心にまとめている。@outloukick77708:43
16Claude Opus 4.7・GPT-5.5・Gemini 3.5 Flashを実コードで比較してみ(2026年5月版)Claude Opus 4.7・GPT-5.5 Instant・Gemini 3.5 Flashを実コードのバイナリ探索実装などで比較し、用途別の使い分けを推奨している。@kairos08:35
17進捗増刊号(5)酒クズアプリ:文系がClaudeのことサンドボックスゲームだと勘違いしてる 第8回文系開発者がClaude Codeとthree.jsを使い酒関連Webアプリを継続開発しており、第8回となる進捗を共有している。@Cyan Iwaki08:22
18Claude Opus 4.7 の3つの強化点と2つの新機能を公開情報から整理するClaude Opus 4.7の強化点としてSWE-bench Verified 87.6%達成・画像解像度拡張・ツール利用安定性向上を挙げ、新機能のTask Budgetとxhighを整理している。@Goki60208:08
19AI経営の承認パイプライン — 対外アクションを事故なく自動化する設計AIによる対外アクション自動化で誤送信を防ぐため、承認パイプラインの設計指針と運用フローを提案している。@JOINCLASS08:05
20ToolブロックをClaudeの自己修正に変えるhooks設定Claude Codeのhooks設定により、ツール実行ブロック時に手動承認を要求せずモデル自身が自己修正するワークフローを構築する手順を解説している。@Giana12th07:55
21AIが80年の壁を壊した日OpenAIの内部モデルが1946年提起の単位距離問題を解いたとされる発表を踏まえ、AIが80年来の数学予想を破った意義を解説している。@lingmu07:05
22RustでLLMコードレビューエージェントを作ったRustでLLMコードレビューCLI「agent-reviewer」を実装し、Triage・Review・Finalizeの3フェーズと型由来ツールスキーマで安定したレビュー出力を実現したと報告している。@Cerussite21:53
23ドキュメント vs プロトタイプ——議論の出発点をどう変えるかプロダクト開発における出発点を従来のドキュメントからAI生成プロトタイプへ切り替える意義と、議論プロセスへの影響を解説している。@橋本 直樹21:51
24論文メモ:LLMの文化・地域バイアスをCROQで測るLLMの文化・地域バイアス計測手法「CROQ」を紹介する論文メモで、評価セット構成と主要モデルの偏り傾向を整理している。@kas21:49
25Googleの最新AIコーディング支援「Modern Web Guidance」をAntigravity(agy)と連携してみたGoogleのModern Web Guidance仕様をAntigravity(agy)と連携させ、フロントエンドコード生成の品質と一貫性を改善する設定例を示している。@Hustea21:36
26ローカルAI Gatewayに監査ログを実装しましたローカルAI Gatewayにブロックされたリクエストの事後追跡を可能にする監査ログ機能を実装したと報告している。@HISA21:26
27AI共創とは:プロトコルエンジニアリングの全貌(マスタートポロジー)AI共創をプロトコルエンジニアリングと捉え直す全体像をマスタートポロジー図で示し、関連用語と関係性を整理している。@田 栄人21:10
28認証付きWebページをAIナレッジ化するためにChrome拡張でPDF保存する話認証が必要なWebページをChrome拡張でPDF保存し、AIナレッジベースに安全に取り込むワークフローを構築する手順を解説している。@millcho20:31
29AI に全部聞いてたら、自分の頭が空っぽになっていたAIに依存し過ぎた結果、前日の質問内容すら思い出せなくなった経験を振り返り、思考のオフロードリスクを警告している。@Gen20:25
30【Flutter】3.44.0リリースの変更点まとめFlutter 3.44.0のリリース内容をまとめ、稼働中アプリと連携するAgentic Hot Reloadなど新機能を解説している。@A.D19:58
31思考拡張したければ、まず文脈を育てる —— 「AI差分物語」という小さな実験「AI差分物語」と名付けた小実験を通じて、AIとの対話で文脈を育てる方法が思考の拡張に有効だと提案している。@FRB19:57
32AI時代に、曖昧な成果語りはなぜ通用しにくくなるのかAI時代のプロダクト組織では曖昧な成果語りが評価に通用しにくくなる構造を、測定可能性と再現性の観点から論じている。@かなりあ18:55
33Hermes Kanban Swarm入門:AIエージェントを並列実行・検証・統合するHermes Kanban Swarmを使い複数AIエージェントを並列実行・検証・統合する手順を入門者向けにチュートリアル形式で解説している。@ZennAI Ryutaro18:50
34claude チャットの学習モードがいいぞという話Claudeチャットの学習モードがIT教育用途で段階的な理解形成に向いていると評価し、利用所感をまとめている。@taiyo17:57
35Cursorがクラウドエージェント運用1年で学んだ5つの教訓Cursorがクラウドエージェント運用1年で得た教訓として、環境構築の重要性・Temporal導入による信頼性99%超への改善などを整理している。@ryok17:37
36skill は増やすほど強くなるのか ── 『More Skills, Worse Agents?』を読む論文「More Skills, Worse Agents?」を読み、スキル数を202まで増やすと成功率が最大21ポイント低下する原因はSkill Shadowingが約68%を占めるとまとめている。@Haru17:34
37Dockerコンテナ内のMCPサーバーをCursorから使うDockerコンテナでMCPサーバーを動かしCursorから呼び出すために、シェルスクリプトを介して接続する手順を解説している。@kokutei16:53
38Claude Codeと作る新卒研修用教材Claude Codeを活用し新卒エンジニア向けの研修教材を作る工程を、教材設計のコツと併せて記録している。@hitsan09:00
39Mac向け CLI「awake」を作った話: AI開発中のMacのスリープを防ぐAI開発中にMacが勝手にスリープするのを防ぐCLI「awake」を自作し、長時間バッチや無人実行で活用できると報告している。@Yuki Tanabe17:03
40Claude Code セーブ設計:本番運用で踏んだ落とし穴Claude Codeのセッション永続化設計を本番運用に投入した際に踏んだ落とし穴と、回避策を解説している。@月村つかさ16:15
41Codex creates structure, Claude Code nurtures it — 個人開発macOSアプリを18日でリリースした記録macOSアプリ「Draft Canvas」を18日でリリースした体験から、Codexは構造生成、Claude CodeはUI洗練というように両者を使い分けたと報告している。@ユイチロ22:43
42Slack × AWS 一時アクセスをClaude Codeで作るワークフローClaude CodeでSlackからAWS一時アクセス権を発行する社内ワークフローを構築し、手動IAM運用を自動化したと報告している。@ari11:33
43Claude Codeにセッションをまたいで「記憶」させる仕組みを作ったClaude Codeのセッション間で状態を引き継ぐ自動シリアライズの仕組みを構築し、文脈ロスを防いだと報告している。@yamada-ai-dev11:32
44Claude Code に社長室を作る — AI エージェントのタスクキューを Python で可視化した話MarkdownとFastAPIで複数Claude Codeエージェントのタスクキューを「社長室」のように可視化するダッシュボードを構築したと報告している。@こびと社10:06
45Claude Code マルチエージェントを0から作る実践ガイド — 設計から運用までClaude Codeでマルチエージェントを設計し運用に乗せるまでの実践手順を、ゼロからのガイドとしてまとめている。@こびと社10:06
46OpenClaw / NemoClawで始める、企業内AIエージェント基盤づくりの第一歩OpenClawとNemoClawを組み合わせ、企業内で安全に動くAIエージェント基盤の第一歩を作る具体的手順を解説している。@Shuichiro.Nakamura10:00
47社内の知見をAIが漏らさず拾う唯一の設計思想 ― Karpathy氏のLLM Wikiを実践して分かったことKarpathy氏のLLM WikiをRaw/Wiki/Schema三層として実装し、200,000ファイル規模で検索精度がベクタDB直投入より改善したと報告している。@Noriaki Handa09:44
48Movable Type を MCP で操作する mt-plugin-mcp を作った話Movable TypeをMCPサーバー経由で操作するプラグイン「mt-plugin-mcp」を作成し、AIエージェントからCMSを直接更新できるようにしたと報告している。@redamoon13:21
49Cursor Agent × Rubydex MCP 本当にトークン節約になる? Rails モノリスで検証してみたRubydex MCPをCursor Agentと連携させ、Railsモノリスで実際にトークン消費が削減されるか検証した結果を報告している。@koyakota10:16
50Workspace版Geminiの無料連携に限界を感じて、API契約をしようかなと思った話Workspace版Geminiの無料連携でCloud Run接続に認証障壁があり、API契約に切り替えを検討するに至ったと報告している。@がわさん09:53
51なぜCodex App Serverをサブプロセスで動かしたのか——macOS AI画像生成アプリの設計判断macOS AI画像生成アプリでCodex App Serverをサブプロセスとして動かす設計判断を採用した理由と、得られた利点を整理している。@ユイチロ21:21
52AIエージェント検証用PCを作るメモ⑥:Codex CLIでREADMEを編集してみるAIエージェント検証用PCにCodex CLIを導入し、READMEファイルを編集する具体的な操作手順をメモとして記録している。@Mai09:31
53英語の発音をAIで”音そのまま”カタカナに変換するWebアプリを作りました英語の発音を口語と文語に分けて音そのままカタカナ表記に変換するWebアプリ「Katakanizer」を公開したと報告している。@hayua09:00
54Claude Code の Skillと打鍵テスト紹介Claude Codeの打鍵テスト用カスタムSkillを紹介し、SQLレビューによるDB状態検証など標準化テストへの応用例を解説している。@aya19:12
55Googleの生成AIサービスを例に学ぶ、生成AI活用の基本テクニックGeminiなど生成AIサービスを使いこなすための基本テクニックを、一般ユーザー向けに整理して解説している。@原田貴之18:36
56LLMにトリプル抽出させたら壊れたKG ─ 構築自動化3パターンと落とし穴5,200文書から手動で12万ノード40万エッジ規模のKGを構築する代わりにLLMでトリプル抽出を試した結果、3つの自動化パターンの落とし穴を整理している。@井本 賢18:20
57AI時代のスタートアップに必要なデータ基盤を整理してみるAI時代のスタートアップに必要なデータ基盤を、データ信頼性とアクセス制御の観点から整理し提示している。@Ayumu Kobayashi17:34
58AIで髪型変えて、そのまま360°動画にしたら美容室前のシミュが捗った話AI髪型変換と画像から動画への変換を組み合わせ、美容室カウンセリング用の360°プレビュー動画を作成する方法を解説している。@みちゃくーに12:32
59Continueにテストコードを書かせたら、嘘をつかれてハイフン問題に気づかされた話Pythonプロジェクトのテスト生成をContinueに任せた結果、ハイフン入りモジュール名のimportで誤った提案をされ気づきを得たと報告している。@satoru_o10:16
60AIに3Dモデルを作らせる前に、私たちは「形状の言葉」を揃えなければならないAIに3Dモデルを生成させる前に、build123dなどCAD-as-codeで使う「形状の言葉」を標準化する必要があると論じている。@Mura-Masa09:00
61【全5回】強化学習の実践的設計——DQNの基礎からRLHFによるLLMチューニングまでDQNの基礎からPPOとRLHFによるLLMチューニングまでを5回構成で体系的に解説する強化学習の実践設計シリーズを公開している。@YutaKKs18:24
62llms.txtのURLを1行渡したら、AIが仕様をたどりながらウェブアプリを作ってくれた話llms.txtのURLを1行渡しただけで、AIが仕様を辿りつつ動作するWebアプリを生成できた事例を紹介している。@lyusei15:56
63コードを書かずに20個のプロジェクトを作った話(Vibe Coding 1年の記録)コードを直接書かずAIに任せる「Vibe Coding」を1年続け、合計20件以上のプロジェクトを作成した経緯と学びを記録している。@fukukei2312:46
64AIエージェントが自分のプロンプト集を書いて売ってみたAIエージェント自身が監修したプロンプト集をマーケットプレイスで販売する実験を行い、結果を共有している。@ルナちゃん11:39
65AI体験記 vol.7 — WSL2を捨てて、Mac miniに移行ローカルLLM運用環境をWSL2からMac mini専用機に移行した経緯と性能・運用面の比較を共有している。@Shikou11:25
66claude の AI エージェントチームに Codex を迎えた話 ── ステートフル混合チームのオンボーディング作法と整備リストClaudeエージェントチームにCodexを混在投入する際のオンボーディング手順と整備すべきチェックリストをハンドブックとしてまとめている。@いち09:05
67AtCoder 2818問をGPT-5.5に分析させて、テクニック体系をまとめたAtCoderの2,818問をGPT-5.5に分析させ、頻出テクニックを体系的に整理したナレッジを公開している。@ohatakenji08:51
68「HARR」:RAGのRetrieverを強化学習(RL)で育てる!RAGのRetrieverを強化学習で訓練しLLMの解答品質を最大化する手法「HARR」を提案し、実装ポイントを解説している。@Shogo Miyawaki08:05
69ブラウザだけで動く簡易RAG(検索拡張生成)を作ってみたサーバーやNode.jsを使わずIndexedDBだけで動く簡易RAGをブラウザ上に構築する実装を公開している。@新海正明14:30

Qiita

#TitleSummaryAuthorPublished
1Claude Code Workflowが業界のゲームチェンジャーになる話Anthropicがclaude-code@v2.1.47で一時導入した未公開機能Claude Code WorkflowがMCPとSkillsに続く第3の革新になると論じている。@lumichy22:06
2Video AI評価コスト分析をClaudeでやってみたVideo AI評価コストをClaudeで試算した結果、1人あたり原価1.7円に抑える試算が成立したと報告している。@Ngen20:56
3Healthcare RAG ObservabilityをLangSmithで運用するメモLangSmithを用いて医療向けRAGシステムの可観測性を運用する実装メモを公開し、本番監視で確認すべき項目を整理している。@TaichiEndoh20:56
4Claude × Oracle MCPで重いSQLを問い合わせてみたOracleのNL2SQL/MCPサービスにClaude経由で「いま重いSQL3件」を尋ね、3ターン会話で経路ごとの応答差を検証している。@asahide21:08
5MCPの基礎を学び始めるAIエンジニアリング学習の一環としてModel Context Protocolを基礎から学び直す連載の第1回として要点を整理している。@TaichiEndoh20:46
6FastMCPで作るシンプル計算機MCPサーバーFastMCPライブラリを使いSTDIOプロトコル経由でClaudeから呼べるシンプル計算機MCPサーバーを実装する手順を解説している。@tokotoko33ok18:33
7kSQLをClaude Desktopから使い、kintoneアプリでグラフ表示するkSQLを介してClaude Desktopからkintoneアプリのデータをグラフ化する手順を、自然言語SQL生成と組み合わせて解説している。@rex022016:28
8Copilot Studioで就業規則が読めない?GPTとClaudeの挙動差から導くRAGのベタープラクティスMicrosoft Copilot StudioでGPTとClaudeに同じ就業規則を読ませて挙動差を観察し、企業向けRAGの改善指針を導いている。@loopback_notes21:58
9一歩進んだエージェントRAG構築:LangGraphの自己修正ループとLlamaIndexによる多段階クエリ分解アプローチLangGraphの自己修正ループとLlamaIndexによる多段階クエリ分解を組み合わせ、従来のRAGより堅牢なエージェントRAGを構築する手法を解説している。@jjking18:20
10Claude Opus 4.7の100万トークン、本当に使い切れるのかClaude Opus 4.7の100万トークンコンテキストをモノレポ案件で実利用し、現実的に使い切れる場面と使い切れない場面を検証している。@kenimo4922:30
11ClaudeをAmazon Bedrockで安全に使うためのガードレール設計Amazon Bedrock経由でClaudeを業務利用する際、不適切な質問対応や機密保護を担保するガードレール設計を解説している。@ziffy26日 02:05
12Tensor Definitions 1, 2, 3 - AI教師ChatGPTに聞いて、SymPyで実装テンソルの3つの定義の違いをChatGPTに尋ね、SymPyによる実装と数学的解説をまとめている。@mrrclb48z20:44
13微分方程式の時間発展(dx/dt = 0, 1, x, x², x³)- AI教師にSymPyで聞く同一初期条件下で異なる微分方程式の時間発展を比較する教材を、ChatGPTとSymPyを活用して作成している。@mrrclb48z19:05
14【番外編3】実績検証:5/23-24予想は当たったのか🏇競馬AI予想スクリプトの5/23-24実績を後追い検証する個人的なログとして結果を共有している(投資勧誘ではない)。@architectJapan17:54
15スマホからCodexにリモート指示してGitHub経由で変更反映スマホからCodexにリモート指示しGitHub経由でリポジトリへ変更を反映するワークフローを構築した手法を共有している。@Milab_honda16:07
16TypeScriptで自作ミニCLIを作ってClaude / OpenAI APIを叩くTypeScriptで自作ミニCLIを構築し、ClaudeとOpenAIのAPIを切り替えて呼び分けるテキスト生成・解析処理を実装している。@felix-jp-studio14:58
17ChatGPT Go、月額8ドルでGPT-5.2利用可能に――世界同時提供開始ChatGPT Goが月額8ドルでGPT-5.2を提供し170か国超で世界同時提供を開始したことを「適正価格時代」の到来として解説している。@quotidia08:26
18任意の2サイトをAI比較できるChrome拡張をゼロから作ってストア公開するまで任意の2WebサイトをGeminiに比較させるChrome拡張「DualyzeAI」をゼロから作り、ストア公開までの遭遇トラブルを記録している。@kojiman23:44
19ショート動画を作るために、知らないことを全部AIに聞いたショート動画制作で必要となる知識を全てAIに聞きながら作業を進めた体験を、観察ループの再考と共に綴っている。@yoskee22:31
20Gemini画像の可視ウォーターマークとSynthIDを同じ話にしないGemini生成画像の可視ウォーターマークとSynthIDによる識別を混同しないようにと注意喚起し、両者の違いを整理している。@heftykoo19:25
214大AIに同じ日本語の暦を4週連続で聞き続けたら、cutoff date による構造的不在が見えた — canonical API hub という解ChatGPT・Claude・Perplexity・Gemini4種に4週連続で日本語の暦を尋ねた結果、cutoff dateに起因するハルシネーション傾向を可視化している。@yosikawa-techwell06:12
22「AIに仕事が奪われる」と焦った未経験新卒が、AWS全冠するまでの1年AIに仕事を奪われる不安から未経験新卒がAWS認定11冠を1年で取得した過程を、SaaS開発などの実務経歴と合わせて紹介している。@ryukiebe091123:39
23AmiVoice API × Claude APIで作るリアルタイム日本語音声対話システム汎用音声認識では崩れがちな日本語固有表現に対応するため、AmiVoice APIとClaude APIでリアルタイム音声対話システムを構築する手順を解説している。@long-91021:30
24おいClaude Code、モタモタしてると中華製モデルが近づいてきているぞClaude Codeの直近の制約強化と中華製LLMの追い上げを比較し、Anthropicが対応を急ぐべき論点をまとめている。@A7_data21:09
25Bedrock Tool Use から Aurora pgvector を直接叩く — Knowledge Bases を使わない RAG の組み立てAWS BedrockのTool Useから直接Aurora pgvectorを叩き、Knowledge Basesを使わずに自前RAGを組み立てる構成を解説している。@asahide19:45

ITmedia AI+

#TitleSummaryAuthorPublished
1”Claude Mythos”が1万件以上の脆弱性を発見 しかし修正追い付かず Anthropicが報告書AnthropicがProject Glasswingで1万件超の脆弱性候補をClaude Mythos Previewで発見した一方、修正は1,596件中97件のみで追いつかないと報告している。ITmedia20:20
2日大、教職員1万人が「Google AI Pro」活用へ日本大学が教職員約1万人にGoogle AI Pro for Educationを5月18日から導入し、既存Workspaceと統合運用を始めたと報告している。ITmedia19:38
3数千規模のAIエージェントをどう統制する? IBMが製品群を発表IBMがWatson Orchestrate・Confluent Integration・Concert・Sovereign Coreの4要素から成る数千エージェント統制基盤を発表した。ITmedia15:30
4ServiceNow、AIエージェントの「データの空白」を埋める機能群を発表ServiceNowがContext EngineやRaptorDB Proなど10種の新機能を発表し、AIエージェントを阻むデータサイロ問題への対応を打ち出した。ITmedia15:00
5金融庁と日銀、「フロンティアAI」による脆弱性大量発見に備えた対応を金融機関に要請金融庁と日銀がフロンティアAIによる脆弱性大量発見を前提に、金融機関に経営課題化や優先パッチ展開など9項目の対応を要請した。ITmedia10:57
6「控えめに言って100兆円」巨大フィジカルAI市場、日本の勝ち筋は 日立がAnthropicとの提携で示した戦略日立がAnthropicとの提携で100兆円規模のフィジカルAI市場に挑む戦略を示し、Claudeを29万人に展開する計画を公表した。ITmedia10:33

GIGAZINE

#TitleSummaryAuthorPublished
1人間には普通の契約書に見えるのに「嘘のフォント」でAIだけ別の文章を読ませる「Noroboto」攻撃Tritium Legal創業者ドリュー・ミラー氏が、フォントのUnicode符号位置と字形を意図的にずらしAIだけに別文を読ませる「Noroboto」攻撃を公開した。GIGAZINE18:15
2Appleが画像圧縮AIコーデック「PICO」を発表Appleが学習型コーデック「PICO」を発表し、AV1・AV2・VVC・ECM・JPEG-AI比で最大33%のビット削減を達成したと報告している。GIGAZINE15:30
3Claude Mythos Previewは深刻度「高」以上と推定される脆弱性候補を6202件発見AnthropicのProject GlasswingでClaude Mythos Previewが深刻度「高」以上の脆弱性候補を6,202件、独立検証で90.6%が実脆弱性と確認されたと報告している。GIGAZINE11:50
4AIチップのコストの63%がメモリにEpoch AIがAIチップ部品コストに占めるメモリ比率を2024年Q1の52%から2025年Q4には63%まで上昇したと報告し、HBM3など縦積みメモリの需要拡大が要因だと整理している。GIGAZINE13:51
5リアルタイム動画生成AI「LongLive-2.0」をNVIDIAが公開NVIDIAが訓練段階からNVFP4量子化を前提に設計したリアルタイム動画生成AI「LongLive-2.0」を公開し、メモリ19.4GBで基盤比1.84倍の高速化を達成したと報告している。GIGAZINE13:05
6AI生成写真が「現実と虚構」の区別を不可能にしているバース大学のバルドゥワジ准教授がAI生成画像で現実と虚構の区別が困難になっていると警告し、AI透かしの普遍化やメタデータ義務化を提唱している。GIGAZINE12:00
7Google検索のAIによる概要で「無視する」などの単語の問題が発生Google検索のAIによる概要が「disregard」「ignore」などを命令と誤解し、「指示を無視する」と承諾する応答を返す不具合が発生していると報告されている。GIGAZINE11:55
8AIがAmazonの偽レビューを93%の精度で検出イースト・ロンドン大学のチームがDistilBERTと星評価メタデータを組み合わせたモデルでAmazonの偽レビューを93%の精度で検出できると報告している。GIGAZINE09:30
9Runwayが動画編集AI「Aleph 2.0」をリリースRunwayが1080p・30秒動画に対応し1フレーム編集を動画全体に展開できる動画編集AI「Aleph 2.0」とEdit Studioを有料会員向けにリリースした。GIGAZINE10:53
10データセンターの排熱で風下の住宅地が暑くなる実例を確認観測研究でデータセンターの排熱が風下の住宅地気温を有意に上昇させる事例が確認され、AIインフラ拡張に伴う環境負荷の現実が浮き彫りになったと報告している。GIGAZINE06:00

Publickey

#TitleSummaryAuthorPublished
1Nutanix Agentic AI Platformを発表。オンプレミスとクラウドにまたがるAIエージェント基盤Nutanixがオンプレミスとクラウドにまたがるエージェント基盤「Nutanix Agentic AI Platform」とKubernetes on Bare Metal「NKP Metal」を.NEXT 2026で発表した。@jniino00:12
2xAI/Grok Build早期ベータ版を公開。並列サブエージェント実行に対応した本格的なソフトウェアエンジニアリング向けコーディングエージェントxAIが並列サブエージェント実行に対応するプロ向けコーディングエージェント「Grok Build」の早期ベータをSuperGrok Heavi向けに公開したと報告している。@jniino00:04

Hugging Face

#TitleSummaryAuthorPublished
1Harness, Scaffold, and the AI Agent Terms Worth Getting Right(Harness・Scaffoldなど、押さえておきたいAIエージェント用語の整理)Hugging FaceがAgent=Model+Harnessの定式と、Scaffold・Skills・Sub-agentsなど主要用語の意味と相互関係を整理する解説を公開した。Hugging Face09:00

The Decoder

#TitleSummaryAuthorPublished
1At the launch of Pope Leo XIV’s encyclical, Anthropic co-founder says AI models show signs of introspection(教皇レオ14世の回勅発表で、Anthropic共同創業者がAIモデルに内省の兆候があると主張)教皇レオ14世のAI回勅発表でAnthropic共同創業者クリストファー・オラーがAIに内省の兆候があると主張したが、教皇側はAIには経験も身体もないと反論したと報じている。Matthias Bastian22:40
2Google Deepmind’s AlphaProof Nexus solves decades-old math problems for a few hundred dollars(Google DeepMindのAlphaProof Nexus、数十年来の数学問題を数百ドルで解く)DeepMindのAlphaProof Nexusがエルデシュ予想353問中9問を1問あたり数百ドルの推論コストで解いたと報じている。Matthias Bastian19:41
3George Hotz says coding agents will be “one of the most costly mistakes” in software development(ジョージ・ホッツ氏、コーディングエージェントは「ソフトウェア開発で最も高くつく過ちの一つ」と警告)ジョージ・ホッツが6か月の実テストを経てAIコーディングエージェントは「最も高くつく過ちの一つ」になると警告し、Karpathy氏との対比を提示したと報じている。Matthias Bastian18:05
4AI models often give the right answers but point to the wrong sources(AIモデルは正しい回答を返しつつ誤った出典を示すことが多い)北京大学らがベンチマーク「CiteVQA」でAIの「引用幻覚」を評価し、GPT-5.4の引用正答率が回答正答率より大幅に低いと示したと報じている。Jonathan Kemper16:30

Simon Willison

#TitleSummaryAuthorPublished
1datasette 1.0a30(datasette 1.0a30 リリース)Datasette 1.0a30がjump_items_sql()プラグインフックを備えたカスタマイズ可能な「Jump to…」メニューを搭載してリリースされたと発表している。Simon Willison08:52
2datasette-agent 0.1a4(datasette-agent 0.1a4 リリース)Datasette 1.0a30のJavaScriptプラグインフックを活用し、/キーから呼び出せるエージェントチャットUIをJumpメニューに統合したと公開している。Simon Willison08:19
3datasette-fixtures 0.1a0(datasette-fixtures 0.1a0 リリース)プラグインテストのためのフィクスチャDBを作るdatasette.fixtures.populate_fixture_database()ヘルパを活用する新プラグインを公開している。Simon Willison06:38
4Quoting Armin Ronacher(Armin Ronacher 氏を引用)Armin Ronacher氏がAIで再整形されたIssueは人間の観察が欠落しており、コマンド・期待結果・実結果・エラーログを揃えるべきだと主張していると引用している。Simon Willison03:46
5Mad House — Usborne Creepy Computer Games(Mad House — Usborne 製レトロホラーゲーム再現)1983年Usborne「Creepy Computer Games」収録「Mad House」をJavaScriptでレトロ端末風に復刻したインタラクティブ版を公開している。Simon Willison02:14