AI News Digest: 2026-05-21
Top 20
AlibabaがAIエージェント向け新モデル「Qwen3.7-Max」を発表
Source: GIGAZINE | Published: 2026-05-21 17:55 JST
- Alibabaがエージェント特化の新モデルQwen3.7-Maxを発表し、約35時間の連続自律稼働と1回のタスクで1,158回のツール呼び出しを実証した。
- SWE-bench Verifiedで80.4を記録しClaude Opus-4.6 Maxの80.8に肉薄、Terminal-Bench 2.0では69.7でDeepSeek-V4-Pro Maxの67.9を上回った。
- MCP-Atlasで76.4、MCP-Markで60.8を出し、いずれもClaude Opus-4.6 MaxやGLM-5.1を超えた。
- カーネル最適化デモではSGLang Triton参照実装比で幾何平均10倍の高速化を達成し、GLM 5.1の7.3倍を上回った。
- YC-Benchの起業シミュレーションでは総収益208万ドルを稼ぎ、前世代Qwen3.6-Plusの105万ドルの約2倍となり、Alibaba Cloud Model Studio経由で近日提供予定とした。
OpenAI、日本政府と一部企業にセキュリティ特化AI「GPT-5.5-Cyber」提供へ
Source: ITmedia AI+ | Published: 2026-05-21 09:23 JST
- OpenAIがサイバーセキュリティ特化モデルGPT-5.5-Cyberを日本政府と承認済みの一部企業に提供する方針を明らかにした。
- 提供は「Trusted Access for Cyber(TAC)」の枠組み内で検討され、最新AIを悪用する攻撃への防御強化を目的とする。
- OpenAI取締役のポール・ナカソネ氏が都内の記者発表会で説明した。
- モデル自体は5月7日(現地時間)に正式発表済みで、今回は日本との連携拡大が焦点となる。
- 具体的な提供時期や提供企業名、GPT-5.5本体との技術的差分は記事では明かされていない。
100 things we announced at I/O 2026(Google I/O 2026の発表100件)
Source: Google AI Blog | Published: 2026-05-21 04:30 JST
- GoogleがI/O 2026の全発表を100項目にまとめ、Gemini 3.5 Flashを皮切りにエージェント中心の製品群を一斉に投入したと総括している。
- 動画生成モデルGemini Omni、開発基盤Google Antigravity、24時間稼働の個人エージェントGemini Sparkを主要発表として挙げた。
- 買い物を統合するUniversal Cart、Nano Banana搭載の画像ツールGoogle Pics、複数ステップ実行のGoogle Flow Agentを公開した。
- 検索のAI Modeが月間10億ユーザーを突破し、夏にSearch agentsを展開予定とした。
- Gemini 3.5 Proは内部テスト中で来月の展開を予定していると記している。
Devinの「Auto-Triage」が革命的すぎる!Slackのアラート監視・トリアージをAIに任せてみた
Source: Zenn | Published: 2026-05-21 18:54 JST
- DevinのAuto-Triage機能を導入すると、メンションなしでSlackチャンネルのアラートやバグ報告を常時監視・一次対応できると報告している。
- 監視対象チャンネルを指定し数行のプロンプトを書くだけで、対応要否の自動判断・自動返信・類似アラートの統合・担当者への自動メンションが動く。
- Hubble社はDatadog MCPとSlack連携の構成で検証し、実装次第では修正PR作成まで自動化できるとした。
- 著者はアラート対応と一次トリアージの負担が「かなり楽になった」と評価し、運用基盤の要になると予想している。
- 公式ドキュメントは継続利用で段階的に精度が改善すると言及しているが、著者は学習効果は未検証としている。
Anthropic Agent SDKクレジットとは?OpenClaw再開と料金設計
Source: Zenn | Published: 2026-05-21 18:16 JST
- Anthropicが2026年6月15日からPro/Max/Team/Enterprise向けに、通常のチャット枠とは別のAgent SDK専用月次クレジットを開始すると整理している。
- 月額クレジットはProが$20、Max 5xが$100、Max 20xが$200、Enterprise Premiumが$200と段階設定されている。
- クレジットはClaude Agent SDK・
claude -p・Claude Code GitHub Actions・SDK認証のサードパーティアプリに適用され、Web/Desktop/Mobile会話や対話型Claude Codeは対象外とした。 - 個人単位で繰り越し不可、超過後は標準API料金か利用停止となる。
- 2026年4月にOpenClawなど外部エージェントのサブスク枠利用を制限した経緯を踏まえ、今回の制度を「制限の部分的復活」と位置付けている。
NVIDIAが拡散言語モデル「Nemotron-Labs-Diffusion」を公開
Source: GIGAZINE | Published: 2026-05-21 15:47 JST
- NVIDIAが拡散と自己回帰を組み合わせたハイブリッド拡散言語モデルNemotron-Labs-Diffusionをオープンモデルとして公開した。
- 自己回帰・拡散・自己投機の3モードを持ち、8BモデルのH100実行では自己投機モードが自己回帰と同じ結果を4倍高速に出力する。
- 正確性ベンチマークでは全モード構成で競合のQwen3-8Bを上回り、コーディングと数学性能でも優位とした。
- 3B・8B・14B・8B-VLM(画像対応)の4種をNVIDIA Nemotron Open Model Licenseで提供する。
- Google(Gemini Diffusion)や日本のELYZAと同領域だが、自己投機モードによる精度と速度の両立で差別化すると説明している。
「SaaSの死」への反撃シナリオ Anthropicショックを覆すIBMの「4つの武器」
Source: ITmedia AI+ | Published: 2026-05-21 07:45 JST
- AnthropicのClaude MythosとClaude Codeが既存SaaSを脅かす「SaaSの死」に対し、IBMがAI Operating Modelの4本柱で反撃する戦略を解説している。
- 4本柱はエージェント技術(watsonx Orchestrate、IBM Bob)、リアルタイムデータ(110億ドルのConfluent買収)、ガバナンス(watsonx.governance)、基盤モデルGraniteとオープンソース活用とした。
- IBMは業績の30%超をSaaS領域に依存しており、この変化への対応が急務だと指摘している。
- 開発者向けIBM Bobは8人のIBMチームとAIで45種類の業務を効率化すると紹介した。
- 経営層の80%がAI導入を検討する一方で実装は20%未満という「AI Divide」を課題として挙げている。
AIで人事異動案作成、工数約98%削減 富士通がトラスコ中山に導入
Source: ITmedia AI+ | Published: 2026-05-21 02:38 JST
- 富士通とトラスコ中山がAIと数理最適化を使う人事異動支援アプリ「お善立て」を導入し、異動案作成の工数を約98%削減したと報じている。
- 1回で100人規模・10の158乗通りに及ぶ組み合わせを、富士通独自の数理最適化モデルで処理する。
- 所属年数・職種・通勤時間・希望部署・持ち家購入時期・役職歴・資格などの定量軸を判断に用いる。
- 複数の社内システムやExcelに分散していた人事データをFujitsu Data Intelligence PaaS上で一元化した。
- 約4カ月の構築期間を経て2026年4月の人事異動から運用を開始した。
月間27億トークンを処理したLLMルーティングの実運用レポート(1ヶ月の振り返り)
Source: Zenn | Published: 2026-05-21 12:01 JST
- 月間27億4,000万トークンを3層ルーティングで処理し、総月額$180でClaude Code Max($220)より安く大量に使えたと報告している。
- Layer1はZ.AI Max(GLM-5.1、月$160)が85%、Layer2はMiniMax Plus(月$20)が14%、Layer3のClaude APIは1%未満だった。
- ピーク時間(15:00-19:00 JST)の429レートリミットで3時間停止した経験から、ローカルプロキシglm-rate-proxyで自動切替を実装し停止ゼロにした。
- MCPツール定義が会話コンテキストの約10%(21.4kトークン)を占有したため、MCPサーバーを7個から6個に減らし35kトークン節約した。
- この1ヶ月でGitHub公開20以上、テスト4,798件、リファクタリング20項目、Zenn記事7本を生んだと記録している。
Claude Code・Codex時代に重要になる「ハーネス」という考え方
Source: Zenn | Published: 2026-05-21 17:30 JST
- AIエージェントの実力はLLMそのものではなく、LLMを実務に接続する実行基盤「ハーネス」が決めると主張している。
- LLMは推論する脳、Claude CodeやCodexは実行環境であり、LLM単体ではリポジトリ読込・ファイル操作・テスト・コマンド実行・git diff確認ができないと整理した。
- ハーネスの機能としてコンテキスト取得・ツール実行・状態管理・検証・権限制御・ワークフロー管理・サブエージェント管理を挙げている。
- 設計の要点を「何を見せるか」「権限範囲」「検証方法」「長時間タスク管理」の4点に集約した。
- 競争軸は「LLM競争→Agent競争→ハーネス競争」へ移り、差別化はどんなハーネスを持つかに依存すると結論付けている。
Vector DBを外したら、RAGではなくAgent Runtimeが残った
Source: Zenn | Published: 2026-05-21 21:16 JST
- ファッション・スタイリングという正解が曖昧な領域でRAGを構築した結果、必要だったのは検索拡張ではなく判断境界が見えるAgent Runtimeだったと結論付けている。
- 従来RAGの問題として矛盾エビデンスの平均化、Vector DBコンテキストの陳腐化、推論構造がLLM内部に閉じて観測不能になる点を挙げた。
- 代替としてRAR(Retrieval Augmented Reasoning)を設計し、canonical/emergingクエリの分離やclaim_typeなど型付き中間表現を導入した。
- 推論の不確実性(conflicts/gaps)を必須フィールド化し、LangGraphベースのstate machineへ落とし込んだ。
- 「verdictではなくframeを返す」設計思想で、判断代行ではなく判断前提の可視化を目指すとし、gemini 3.1 flash liteなど軽量モデルでも成立したとした。
【MindLab】2026 最新モデル実測:Claude Opus 4.7 vs GPT-5.5 vs Grok 4 vs Gemini 3
Source: Zenn | Published: 2026-05-21 16:04 JST
- 4モデルを5軸で実測し「全部で最強のモデルは存在せず、ユースケース別の使い分けが現実解」と結論付けている。
- リサーチではOpus 4.7が引用精度98%・Hallucination最少(0.4件)、コード生成では初回正解率がGPT-5.5の76%でトップ、最終通過率はOpus 4.7の91%が最高だった。
- ツール呼び出しはOpus 4.7のツール選択精度96%が最も高く、Grok 4は81%で最低だった。
- 実測コストはGrok 4が$0.09・14.2秒で最安最速、Opus 4.7は$0.42・24.1秒だった。
- 本番では自社Golden Datasetで50件以上テストし、最低2モデルでフォールバック体制を組むことを推奨している。
Cursorの新モデル「Composer 2.5」とは?開発体験を劇的に変える『ふるまい』の進化と技術的背景
Source: Zenn | Published: 2026-05-21 22:09 JST
- 2026年5月18日公開のCursor Composer 2.5は、ベンチマーク競争よりも長時間タスクや複雑指示への追従といった「ふるまい」の改善に重点を置いたと解説している。
- Composer 2の25倍の合成タスクで学習し、ユーザー意図の汲み取り・過剰変更の回避・エラー後の立て直し・長作業での一貫性を向上させた。
- 技術的背景としてテキストフィードバックによるターゲット型RL、合成データ拡充、Sharded Muonとdual mesh HSDPの3要素を挙げた。
- 価格は標準版が入力$0.50・出力$2.50(100万トークン)、高速版が入力$3.00・出力$15.00で、初週使用量が2倍になったとした。
- 基盤モデルはMoonshot AIのKimi K2.5であると記している。
【注意喚起】Antigravity 2.0にアプデしたらIDEが消えて拡張機能などが吹き飛ぶ問題、「アップデート前に」やるべき対策
Source: Zenn | Published: 2026-05-21 17:04 JST
- 2026年5月20日リリースのAntigravity 2.0にアップデートすると、IDEが起動しない・拡張機能が削除される・設定が消える問題が起きると注意喚起している。
- 対策としてアップデート前にVS Codeのプロファイル機能で現在の設定をエクスポートし、ローカル保存しておくことを推奨している。
- 手順はF1でコマンドパレットを開き「プロファイルを開く」から使用中プロファイルをエクスポートする流れだと解説した。
- アップデート後は「プロファイルのインポート」で保存ファイルを読み込み、Ctrl+Sで適用すると復元できるとした。
- 修正パッチのリリースまではアップデート延期を推奨し、プロファイル未作成のままアプデすると設定やり直しになると警告している。
企業LLM選定の軸:Ramp AI Indexから見るAnthropicとOpenAI
Source: Qiita | Published: 2026-05-21 18:35 JST
- 企業のAI支出を可視化するRamp AI Indexを起点に、LLM選定基準がモデルの賢さからセキュリティ・コスト・連携などビジネス要件へシフトしたと論じている。
- 情シス担当者が評価すべき軸として、コスト、データ主権とプライバシー、Google Workspace連携、APIの安定性とスケーラビリティ、エンタープライズ認証の5点を挙げた。
- Anthropic(Claude)は安全性・倫理重視と長文処理に優位で、Google Cloud Vertex AI経由で提供されると整理した。
- OpenAI(GPT)は高性能と豊富なプラグイン・エコシステムが強みで、Microsoft Azure OpenAI Service経由で提供されるとした。
- 最適なベンダーは用途と優先事項で異なると結論付けている。
OpenAIの内部モデルが数学の未解決問題を証明──OpenAIは「重要な転換点」、フィールズ賞受賞数学者は「画期的な成果」と評価
Source: ITmedia AI+ | Published: 2026-05-21 07:15 JST
- OpenAIの内部モデルが、ポール・エルデシュが1946年に提起し約80年未解決だった離散幾何学の問題を自律的に解いたと報じている。
- 対象は「平面にn個の点を置いたとき距離がちょうど1のペアは最大何組できるか」という問題で、エルデシュの予想を否定し、はるかに多くのペアを生む配置を無限に構成できると証明した。
- 幾何の問題に代数的整数論の高度な理論を応用し、一見無関係な分野の知見を結びつける能力を示した。
- フィールズ賞受賞者のティモシー・ガワーズ氏は「AI数学における画期的な成果」と評価し、証明は外部の数学者が検証済みとした。
- OpenAIは数学とAI双方にとっての「重要な転換点」と位置付けている。
AIベンチマーク「自転車に乗ったペリカンを描く」をGemini 3.1 ProやQwen3.6-35B-A3Bにやってもらう
Source: GIGAZINE | Published: 2026-05-21 06:00 JST
- サイモン・ウィリソン氏の「自転車に乗ったペリカンをSVGで描かせる」ベンチマークで、半年でモデルの描画品質が大きく向上したと紹介している。
- 2025年9月のClaude Sonnet 4.5はペリカンと自転車の関係がぎこちなかったが、2026年2月のGemini 3.1 Proでは自然になり、指示していない魚まで描いた。
- Qwen3.6-35B-A3BはClaude Opus 4.7より自然な描画で、ノートPC上でも動作可能だった。
- GLM-5.1は自転車に自然に乗っていたが、アニメ化では不安定だったと評価した。
- ウィリソン氏は2025年11月を変曲点と位置づけ、このベンチマークが有用なベンチマークとしての限界を超えたと結論付けている。
Google I/O, Gemini Spark, Antigravity(Google I/O・Gemini Spark・Antigravity)
Source: Simon Willison | Published: 2026-05-21 00:32 JST
- Simon Willison氏はGoogle I/Oの発表のうち、個人向けエージェントGemini SparkとAntigravityを中心に分析している。
- Gemini SparkはGmail・カレンダー・Drive・Docs・Sheets・Slides・YouTube・MapsとつながりGemini 3.5 FlashとAntigravity上で動くと整理した。
- エンタープライズ向けには各タスクを隔離された一時的VMで実行してセッション間のデータ重複を防ぐ仕組みを挙げた。
- Agent Gateway経由でData Loss Prevention(DLP)ポリシーを施行し、ユーザー認証情報を暗号化してエージェントに直接露出させない設計を紹介している。
- Antigravity CLIはオープンソースのGemini CLI(Apache 2.0、2026年6月18日終了予定)を置き換えると指摘した。
A new experiment brings better group meetings to Google Beam(Google Beamにグループ会議向けの新実験が登場)
Source: Google AI Blog | Published: 2026-05-21 01:45 JST
- GoogleがGoogle Beamにグループ会議向けの新実験を導入し、同僚を実物大・自然な音声で表示してハイブリッド会議の包含性を高めると発表している。
- HP Dimensionのイマーシブディスプレイで非Beam参加者を実物大表示し、空間オーディオで各話者の声を正確に定位する。
- 研究では社会的つながりの実感が50%向上し、会話への貢献能力の自己報告が21%増加したとした。
- 「ハイブリッド包含ギャップ」の解消に効果的だと位置付けている。
- Google WorkspaceおよびZoomとの統合に対応予定で、複数デバイス対応の拡大実験も進めているとした。
Google検索のAIモードの回答に広告が含まれることが正式発表される
Source: GIGAZINE | Published: 2026-05-21 12:13 JST
- GoogleがAIモードの回答内に広告を挿入することを正式発表したと報じている。
- 広告は会話に応じてAIが製品を提案する「Conversational Discovery ads」と、一覧回答に広告を混ぜる「Highlighted Answers」の2種類とした。
- いずれもAI生成テキストと画像で構成され、左上に「Sponsored」ラベルを表示する。
- 限定割引を含むDirect Offersや、広告内でGeminiに質問できるBusiness Agent for Leadsも追加するとした。
- 今後数カ月以内に通常の検索結果広告にもAI生成テキストを付与する方針で、現在はテスト段階だとしている。
All Articles
Zenn
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | GAS×Claude APIで社内問い合わせ分析を全自動化した話 | Google Apps ScriptとClaude APIを組み合わせ、店舗の自由記述問い合わせの分類・集計を自動化した運用を解説している。 | @takoeve | 20:32 |
| 2 | Claude Code × Obsidian で「知識の記録役」を雇う運用をしてみた話 | セッション記憶に頼らず、ClaudeのコンテキストをGit管理のObsidian Vaultに保存する二層永続化の運用を提案している。 | @hikacode1 | 20:12 |
| 3 | ローカルLLMの「感情知能」を測る — EQ-Bench 3 で Qwen3.5-122B(int4) をベンチマーク | 知識ではなく対人ニュアンス把握を測るEQ-Bench 3で、ローカルのQwen3.5-122B(int4)の感情知能を評価した。 | @rmizushima | 17:33 |
| 4 | Anthropic Partner Basecampに参加してきたお話 | サンフランシスコ開催のAnthropic Partner Basecampに参加し、各国エンジニアやコンサルが知見を交換する熱気を報告している。 | @伊佐眞皇(Shino Isa) | 17:03 |
| 5 | Chat SDK × Anthropic Managed Agents で作る Slack AI エージェント | VercelのChat SDKとAnthropic Managed Agentsを組み合わせ、複数プラットフォーム展開を簡素化するSlackエージェントの作り方を示している。 | @TKNR | 15:32 |
| 6 | AIエージェントを”ハブ”にする設計 ── Claude + MCP + Bashで複数サービス連携の複雑さを預ける | iCloud→画像解析→栄養DB→食事記録→LINEの連携をClaudeに任せ、独自ビジネスロジックをほぼ書かずに済む設計を解説している。 | @h_motohiro | 15:18 |
| 7 | 許可リストか、拒否リストか — AI 時代に再発見した『コード変更量最小化』の原則 | AI生成の許可リストが意図せぬ検証失敗を招いた事例を通じ、実装方式の選択が保守コストに与える影響を論じている。 | @fixU | 14:21 |
| 8 | LLMでSNS投稿を月200本自動生成するアーキテクチャ設計 | マーケのコンテンツ疲弊を背景に、戦略整合を保ちつつ月200本のSNS投稿を自動生成するアーキテクチャを設計したと報告している。 | @尾崎功汰 | 14:06 |
| 9 | Skill と Agent の境界線 - CULTIBASE で SNS 投稿を「誰でも回せる」仕組みにしてみた話 | SkillとAgentの境界を定義することで、個人依存だったSNS運用をチームで回せる体制へ移行したと述べている。 | @shunn | 11:36 |
| 10 | QAボトルネック解消に挑戦 - QAプロセスを qa-orchestrator に任せてみた | qa-orchestratorにQA工程を任せ、テスト設計工数を約45%削減し品質を標準化したと報告している。 | @miyashita | 10:00 |
| 11 | AIモデル競争、新局面へ | GPT-5.5やGemini Omniの登場で、AI競争の主戦場が生の性能から実用性とエンタープライズ最適化へ移ったと分析している。 | @lingmu | 07:29 |
| 12 | AIに任せていいこと・人間がやるべきこと【Claude依存中の私が考えた】 | Claudeを3週間使った経験から、AI導入後は人間が労力を割くべき対象が根本的に変わると論じている。 | @レイン | 05:52 |
| 13 | Claudeって何ができるの?初心者が実際に使ってみた話【実体験あり】 | プログラミング未経験者がClaudeでPythonツールを開発し、エラー解決やデバッグ、デプロイまで進めた体験を記録している。 | @レイン | 05:31 |
| 14 | ChatGPTとの会話が迷子にならないように、「発言の意図」を先に伝えるようにした | 曖昧な質問が訂正や脱線を招いた経験から、発言の意図を先に伝えて会話の迷子を防ぐ運用にしたと述べている。 | @はる | 22:01 |
| 15 | 作曲できない私が、AIで「日本っぽいビッグバンドJazz」を作ってわかったこと | 作曲未経験の著者がAIで和風ビッグバンドJazzを作り、ランダム生成ではなく言語による音楽ディレクションだったと気づいたと記している。 | @kista643 | 14:01 |
| 16 | Antigravityを使ってAndroidアプリを作ってみた | I/O 2026発表のAntigravity 2.0でプロンプト駆動によりAndroidアプリの作成・ビルド・実行を試した体験を報告している。 | @furusin | 21:53 |
| 17 | 実装後の “なんか違う” を、実装前の10分で消す | エージェントが仮定で補完して動く性質を踏まえ、実装前10分の前提すり合わせで手戻りループを防ぐ手法を提案している。 | @53able | 21:40 |
| 18 | 思考拡張の実践理論(Draft) ~AIと話していたら、脳の使い方が変わってきた話~ | AIを協働相手とし、対話を通じて自律的に思考を進化させる枠組みを試論として提示している。 | @tamasub | 20:09 |
| 19 | 日本はオンチェーン金融のどこに賭けたか——自民党PT提言から読む国家戦略の設計図 | 自民党PTが2026年5月19日に出した13ページの提言を読み解き、AIとオンチェーン金融に関する国家戦略の設計図を分析している。 | @takupeso | 20:09 |
| 20 | 継続事前学習(CPT)とファインチューニング(FT)は何が違うのか ── 実装目線で見る決定的な3点 | 損失関数・データ要件・学習対象の3点でCPTとFTの違いを整理し、用途に応じた選択基準を実装目線で示している。 | @だー@AIDEN | 19:40 |
| 21 | フレームワーク利用者のままではいけない | AIによりアプリ開発がコモディティ化する中で、フレームワーク利用者は標準CRUDを超える技術的深さを身につけるべきだと主張している。 | @Site-C | 18:50 |
| 22 | devenvで構築する最強の開発環境 ─ Vibe Coding時代に効くNixベース宣言的セットアップ | ローカル・CI・エージェント実行で一貫性を保つため、Nixベースの宣言的セットアップでAIコーディング向け環境を構築したと解説している。 | @TKNR | 18:22 |
| 23 | ZeNxの生活システムをAIがデバッグ、脳のRAMを解放する哲学 | ルーチンの意思決定や事務作業をAIに自動化させ、創造的思考のために脳のRAMを解放する考え方を提示している。 | @ZeNx | 18:19 |
| 24 | Agent Memoryって知ってる?――完全に理解した人へ贈る絶望の谷 | プロトタイプでは動くエージェントメモリが、複数ユーザー・長期運用の本番で破綻する課題を「絶望の谷」として論じている。 | @Memorylake AI | 17:47 |
| 25 | 「あそこにバグがあるはず」を信じすぎる ── デバッグで時間を溶かす5つの認知バイアス | 実際のインシデントを例に、確証バイアスがデバッグを非効率にする5つの認知バイアスを分析している。 | @井本 賢 | 17:38 |
| 26 | 優秀な人を採ったのに、なぜ組織は変わらないのか - 構造で育てるプロダクト組織シリーズ付録2 | 採用を人材獲得ではなく構造設計と捉え、役割の明確化と判断の分散が組織を変える鍵だと論じている。 | @かなりあ | 17:26 |
| 27 | ECショップをAI決済対応した話 (JPYC・x402) ── EC 編 | 既存ECにx402 HTTP決済プロトコルを統合し、AIと人間の双方が支払える仕組みを実装した手順を解説している。 | @mameta_zk | 17:26 |
| 28 | メスガキ AI に英語を煽られながら学ぶ — ペルソナ設計と Gemini 音声入力で「発音矯正」まで届けた話 | ペルソナ設計とGemini音声入力を組み合わせ、発音矯正まで届く英会話練習アプリを開発したと報告している。 | @zhner | 17:06 |
| 29 | DeepSeek V4 Flash (ds4.c) を Lisp 的に扱う | 284BのDeepSeek V4 Flashをds4.c実装でローカル動作させ、Lisp的な自己修正を試みた取り組みを記している。 | @jun.manabe | 20:39 |
| 30 | 製造業RAGを意思決定者に説明する——導入ロードマップと1枚資料の設計 | 動く実装と承認獲得の間のギャップを埋めるため、意思決定者向けの導入ロードマップと1枚資料の設計を解説している。 | @ku_kyoto_lab | 20:09 |
| 31 | 製造業RAGの本番運用設計:Evals・Observability・Fallback【コード付き】 | 製造業RAGの本番運用に必要なEvals・Observability・プロンプトのバージョン管理・フォールバックをコード付きで解説している。 | @ku_kyoto_lab | 19:41 |
| 32 | LLM解説シリーズ:Self-Attentionを数式と実装から理解する | 「Attention Is All You Need」を基に、Q/K/Vの直感と計算量からSelf-Attentionを数式と実装で解説している。 | @kas’s blog | 18:58 |
| 33 | iPhone にローカル LLM 載せようとして、 結局 Apple Foundation Models に戻った話 | ずんだもん方言翻訳アプリ向けにiPhoneでローカルLLMを試したが、検証の末Apple Foundation Modelsに戻ったと記している。 | @kitadesign | 18:42 |
| 34 | 【Nishika 論文サク読み 第10回】Nemotron 3 Nano Omni | テキスト・画像・動画・音声をネイティブ対応するNVIDIAのNemotron 3 Nano Omniを、MoEによる効率推論の観点で読み解いている。 | @y.takayama | 18:00 |
| 35 | コーディングエージェントの『たぶん大丈夫』を、skill で止める | エージェントが指定外バージョンで旧パターンに頼る問題を、skillによる検証ゲートで実装前に止める手法を提案している。 | @Haru | 12:25 |
| 36 | Snowflake Cortex AIで非構造データパイプラインを作る ― PDFの自動取り込みからチャンク化まで全コード解説 | 外部Vector DBやインフラを使わず、SQLとPython UDFだけでPDFの取り込みからチャンク化までのパイプラインを構築したと解説している。 | @sunaaaap | 12:00 |
| 37 | Antigravityを使ってGoogleの新しいTUI Antigravity CLIを試してみた | Antigravity CLIのセットアップを実演し、従来のGemini CLIとmacOS上でのコード生成を比較している。 | @ほき | 07:00 |
| 38 | AI宿題サポートを復習メモ作りに使ってみた | AI宿題サポートを答え取得ではなく復習メモ作りに使い、ミスの整理と概念理解で再発防止につなげたと述べている。 | @raikazenoshin | 19:25 |
| 39 | AIエージェントに財布を渡す時代、いちばん怖いのは「暴走」より「許可したつもり問題」 | AIに金銭権限を渡す時代の最大のリスクは暴走より「許可したつもり問題」だとし、責任の所在を問い直している。 | @剛 | 13:56 |
| 40 | CloudWatch Logs のエラー分類を Claude に任せる — Bedrock + Lambda で意味解釈する SRE 設計 | Bedrock経由のClaudeでエラーログを意味分類し、ルールベースを超えて意味を理解し一次対応を提案するSRE設計を提案している。 | @ojt | 21:12 |
| 41 | Claude Code 用のエージェントを Codex にも対応させる | ScalarDB設計エージェント「Nexus Architect」をClaude CodeからCodexにも対応させ、ツール差分と互換性を比較している。 | @wfukatsu | 20:45 |
| 42 | Claude Code のアップデート・再インストール・認証エラー等の解決方法 | バージョン確認や認証失敗など、Claude Codeのよくあるエラーを診断コマンド付きで解決する手順をまとめている。 | @sarap422 | 18:39 |
| 43 | ClaudeCodeで自前スキルを作ってみた〜〜〜!-“Grill-me”からの”Self-Grill” | 自己批評スキル「Self-Grill」を単一批評から多視点検証へ発展させ、v4設計で4.5倍の問題を検出したと記している。 | @傍流社会科学系研究者 | 12:32 |
| 44 | Codex/Claude Codeの作業完了をスタックチャンにしゃべらせる | Stop Hook経由でM5Stackロボットの音声APIを呼び、Claude Code/Codexの作業完了を読み上げさせる仕組みを実装している。 | @Hideyuki Fujikawa | 12:05 |
| 45 | Claude Code v2.1.142の変更履歴の8つの旗のうち、4つが error: unknown option で拒否される話 | v2.1.142の変更履歴が示す8つの新フラグのうち4つが、ドキュメント記載に反し未知のオプションとして拒否されると報告している。 | @ゆるくさ | 09:07 |
| 46 | grepやRead地獄を減らしたい。CodeGraphでAIコーディングの探索コストを下げる | 複雑なコードベースでの初期探索コストが大きい問題に対し、CodeGraphでローカルLLMの探索トークン消費を下げる手法を探っている。 | @Masato13 | 23:58 |
| 47 | AzureでRAG検索を作成してみよう!(後編) | Azureでのベクトル概念やストレージアカウント設定、AI参照用ファイル準備を扱うRAG構築チュートリアルの後編を解説している。 | @Ponoka | 12:42 |
| 48 | C3 が C3 自身のルールを破った話 ─ hook で機械的に止めるしかなかった ─ C3 v2.13.0 / v2.14.1 | C3が自身のルールを破ったため、プロンプトでは抑えられずhookで機械的に止めるしかなかった経緯を記録している。 | @satoh-y-0323 | 22:50 |
| 49 | AI開発に複数モデル併用は本当に必要なのか | AI開発における複数モデル併用と役割別モデル割り当ての是非を批判的に検討している。 | @pie | 14:41 |
| 50 | AIエージェントに「確実性」を与えるMCPサーバーを個人開発した話 | 営業日計算やタイムゾーン変換などAIが外しがちな確定的処理に対し、確実な出力を返すMCPサーバーを個人開発したと述べている。 | @ちよよ | 19:25 |
| 51 | 既存サービスにMCPサーバーを組み込む際の設計ポイント | 保険プラットフォーム「Inspire」へのMCP組み込みを例に、確立済みサービスへ統合する際の設計上の考慮点を共有している。 | @あつし | 15:32 |
Qiita
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | Skills/CLAUDE.md/Hook を90日使い分けた4つの選定基準 | Claude Coworkを社内利用した90日の経験から、Skills・CLAUDE.md・Hookを使い分ける4つの選定基準をまとめている。 | @Ngen | 22:27 |
| 2 | 記事から “AIっぽさ” をなくす Skills を作成した - Claude Code プラグイン『16-minds』 | 読者の生成AI疲れに対処するため、記事からAIっぽさを除くClaude Codeプラグイン「16-minds」を作成したと述べている。 | @yukurash | 17:37 |
| 3 | マウスカーソル「メガネ」で大喜びするSonnet(Claude)くんと、すぐにポイするGPTくん日記 | 学習データにない道具を渡したときの反応を観察し、ClaudeとGPTでツール使用の振る舞いが異なると報告している。 | @arumenoy | 16:12 |
| 4 | なぜ「バイブコーディング」は破綻するのか? AI駆動開発の次に来る Spec-Driven Development(SDD)という考え方 | バイブコーディングの限界を指摘し、CursorやClaude Codeを使うチーム向けにSDDなど仕様駆動の方法論を提示している。 | @aakashkavuru101 | 15:12 |
| 5 | ChatGPTでブログ記事を書く方法【SEOに強い3,000字記事を30秒で生成】 | 時間のかかるブログ執筆を、ChatGPTでSEOに強い3,000字記事を30秒で生成する手順として解説している。 | @KotaOzaki984 | 14:11 |
| 6 | Visual Studio 2026でWPFテンプレートを生成AIに作らせたら、sln/slnxで沼った話 | Visual Studio 2026で生成AIにWPFテンプレートを作らせた際、sln/slnxのファイル形式問題で詰まった経緯を記録している。 | @tanoue2715 | 13:33 |
| 7 | ローカル LLM (Ollama) を業務 PC で動かす際のメモリ設計と量子化の選び方 | 業務PCでのローカルLLM運用に向けて、メモリ設計と量子化の選び方をOllamaを例に整理している。 | @pendorix | 23:20 |
| 8 | プロンプトインジェクション対策の基本と実装パターン | ユーザー入力が悪意で操作されモデルが予期せぬ挙動を起こすプロンプトインジェクションの基本と実装パターンを解説している。 | @pendorix | 23:19 |
| 9 | 第9回 「最近こんなことよく言ってない?」:memory hint の遊び心と実用性 | AIキャラクターがfoundation/project memory/summaryを背景に現在の発話へやんわり指摘を入れるmemory hintの活用を探っている。 | @ykojie | 17:33 |
| 10 | ChatGPT Personal Finance入門 — Plaid連携でAI財務アドバイスを実装する | 2026年5月15日にProユーザー向けプレビュー公開されたChatGPTの個人資産管理機能を、Plaid連携でAI財務アドバイスとして実装する手順を解説している。 | @kai_kou | 01:29 |
| 11 | Claude for Legal入門 — 法務AIの12プラグインとManaged Agents APIの実装ガイド | 法務部門・法律事務所向けに、12の実用プラグインと20超のMCPコネクタを備えるClaude for Legalの実装を解説している。 | @kai_kou | 01:29 |
| 12 | Docling と Langflow で表・画像入り文書の RAG を行う | DoclingとLangflowを用い、表や画像を含むPDF・PPTXなど非構造化データを対象としたRAGの構築手順を解説している。 | @harusamet | 16:22 |
| 13 | GPUなしで作るローカルRAG 精度改善編(対応ファイル形式の拡張とHybrid Search) | LM Studio・LangChain・Chromaで作る無GPUのローカルRAGに対し、対応ファイル形式の拡張とHybrid Searchで精度を改善している。 | @valpasucucci43 | 14:08 |
| 14 | 仮)4図で覚えるAgentCore | Bedrock利用を前提に、情報を逐次取得せず効果的に使う考え方として、AgentCoreの構造を4つの図で整理している。 | @plustick | 17:32 |
| 15 | MCPサーバー A2CR が awesome-mcp-servers に掲載されるまでにやったこと | AIエージェント向けタスク受け渡し層A2CRを、awesome-mcp-serversに掲載・マージされるまでに行った作業を記録している。 | @a2cr | 12:10 |
| 16 | CLAUDE.md に pay-per-call-mcp を組み込んだら Claude が勝手に有料 API を使い始めた話 | pay-per-call-mcpをClaude DesktopやCursor等に組み込んだところ、Claudeが自発的に有料APIを使い始めた事例を報告している。 | @LemonCake | 10:31 |
| 17 | ScholaTile 開発日誌 2026-05-12(その2) | Gemini CLIを用いたScholaTile開発の作業ログを、当日のコンテキスト設定から記録した開発日誌として残している。 | @yasumichi | 21:21 |
| 18 | ScholaTile 開発日誌 2026-05-12(その1) | Gemini CLIによるScholaTile開発の一日を、チャット文脈の立ち上げから順に記録した開発日誌である。 | @yasumichi | 21:16 |
| 19 | ScholaTile 開発日誌 2026-05-11(その2) | Gemini CLIを使ったScholaTile開発の5月11日分の後半作業を、コンテキスト設定込みで記録している。 | @yasumichi | 21:09 |
| 20 | ScholaTile 開発日誌 2026-05-11(その1) | Gemini CLIによるScholaTile開発の5月11日前半を、当日の文脈準備から順に追った開発日誌である。 | @yasumichi | 21:04 |
ITmedia AI+
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | AI投資など成果最大化へ国・地域別戦略 自民提言案の全容判明 骨太にも反映 | 高市首相直属の党成長戦略本部が、AIやエネルギー安全保障など17の投資分野で国・地域別戦略を骨太方針に反映する提言案をまとめたと報じている。 | 19:10 |
| 2 | 「仮面ライダーアギト」最新映画、“AI動画”で宣伝 担当者が明かすねらい | 「仮面ライダーアギト」最新映画の宣伝で俳優の変身をAI動画で表現し、公式SNSで大きな反響を得たねらいを担当者が明かしている。 | 11:31 |
GIGAZINE
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | AnthropicがSpaceXAIに対し計算処理費用として月額約2000億円を支払うことが判明 | AnthropicがSpaceXAIのスーパーコンピューターColossus 1と契約し、計算処理費用として月額約2000億円を支払うと判明したと報じている。 | 11:14 |
| 2 | Claudeを開発するAI企業のAnthropicが哲学者や宗教団体と意見交換する理由とは? | Anthropicは安全で有益なAI構築には倫理的検討が必要として、聖職者・哲学者・各宗教指導者と対話しClaudeの「憲法」を検討していると説明している。 | 14:35 |
| 3 | GrokがOpenClawをサポート | GrokがOpenClawを正式サポートし、個人PC上でローカルとクラウドのAIタスク自動化が可能になったと報じている。 | 12:02 |
| 4 | Firefoxの「スマホを振ってウェブページを要約」がiOS版で日本語対応 | Firefoxの「スマホを振ってページを要約」するAI機能がiOS版で日本語に対応し、Android版では英語で提供を開始したと報じている。 | 11:20 |
Publickey
(対象日 2026-05-21 JST に公開された記事はありませんでした)
OpenAI Blog
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | An OpenAI model has disproved a central conjecture in discrete geometry(OpenAIのモデルが離散幾何学の中心的予想を反証) | OpenAIのモデルが約80年未解決だった離散幾何学の単位距離問題を解き、エルデシュの予想を反証したと公式に報告している。 | 00:00 |
| 2 | The next phase of OpenAI’s Education for Countries(OpenAIの国別教育プログラムの次フェーズ) | OpenAIが学校でのAI導入を拡大する次フェーズとして、パートナーシップと教員研修を進めると発表している。 | 00:00 |
| 3 | How Ramp engineers accelerate code review with Codex(RampのエンジニアがCodexでコードレビューを加速) | Rampのエンジニアが、GPT-5.5を使うCodexで数分でコードフィードバックを得られるようになったと紹介している。 | 00:00 |
Google AI Blog
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | We’re announcing new community investments in Missouri.(ミズーリ州への新たな地域投資を発表) | Googleがミズーリ州で次世代人材育成とエネルギー関連プログラムへの投資を行うと発表している。 | 05:40 |
Hugging Face Blog
(対象日 2026-05-21 JST に公開された記事はありませんでした)
Simon Willison
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | Quoting SpaceX S-1(SpaceXのS-1からの引用) | SpaceXのS-1から、Anthropicが2029年5月までCOLOSSUS等の計算資源に月12.5億ドルを支払う契約を引用している。 | 07:26 |
| 2 | How fast is 10 tokens per second really?(毎秒10トークンは実際どれくらい速いのか) | Mike VeermanのHTMLアプリを紹介し、毎秒5〜800トークンの出力速度が体感でどう感じるかを可視化できると伝えている。 | 02:57 |
The Decoder
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | SAP taps Mistral AI to help customers migrate legacy software(SAPがレガシー移行支援にMistral AIを採用) | SAPがMistral AIのモデルを採用し、顧客のS/4HANAへの移行を簡素化すると報じている。 | 23:59 |
| 2 | Deepseek wants to take on Claude Code and OpenAI’s Codex with “Deepseek Code”(DeepseekがDeepseek CodeでClaude CodeとCodexに挑む) | Deepseekが北京にチームを構築し、Claude Code・Codex・Cursorに対抗する「Deepseek Code」を開発中だと報じている。 | 03:48 |
| 3 | LinkedIn’s war on AI slop is not just a policy update—it is an admission that the platform lost control of its feed(LinkedInのAIスロップ対策はフィード制御喪失の告白だ) | LinkedInがAI生成のスロップ投稿を取り締まり、初期テストで一般的な投稿を94%の精度で検出していると報じている。 | 03:21 |
Hacker News
(対象日 2026-05-21 JST に公開されたAI関連記事はありませんでした)