TODAY’S ISSUE 2026年5月23日 · 土曜日 AI FRONTLINE

AIニュースまとめ 2026-05-23｜AlibabaのQwen3.7-Maxが自社製AIチップT-…

2026年5月23日

Top 20

Alibaba’s latest AI model ran autonomously for 35 hours to optimize code for its own custom chip（アリババの最新AIモデル、自社カスタムチップ向けコード最適化を35時間自律実行）

Source: The Decoder | Published: 2026-05-23 19:17 JST

AlibabaのQwen3.7-Maxが自社製AIチップT-Head-ZW-M890のカーネルを35時間連続で自律最適化し、参照実装比10倍の高速化を達成した。
同タスクでGLM 5.1（7.3倍）やDeepSeek V4 Pro（3.3倍）を大きく上回り、KernelBench L3で96%、SWE-Verifiedで80.4を記録した。
35時間の中で432回のテスト実行と1,158回のツール呼び出しを行い、Claude Opus 4.6 MaxやDeepSeek V4 Pro Maxと並ぶ汎用ベンチマーク性能を示した。
学習段階では86時間にわたり報酬ハッキングを自己検出し、10,000件超のチェックから1,618件の不審ケースを自ら検出した。
公開はAlibaba Cloud Model StudioのAPI経由のみで、OpenAI/Anthropic互換インターフェースを提供する代わりにオープンソース化はされていない。

Geminiの新モデル検知から簡易評価までをダッシュボード化した

Source: Zenn | Published: 2026-05-23 00:00 JST

Gemini APIのmodels.listを定期的に叩いて新モデルを自動検知し、軽量な簡易評価まで一気通貫で行うNode.js製ダッシュボードを公開した。
評価は「指定キー入りのJSON出力」「期待語を含む日本語要約」「簡単な推論問題」の3ケースで、結果を0〜1のスコアとして算出する設計である。
models.snapshot.jsonに既知モデルのnameを保存し、差分が出たモデルだけを新規対象としてevaluation-runs.jsonとevents.jsonに記録する。
実行はnpm run monitorとnpm run serveの2コマンドで完結し、localhost:4173上でスコア・レイテンシ・エラー率を比較表示する。
無料枠の制約や429/503の発生を前提とした「初期観測」と位置付けており、過去の評価ランも残して時系列の傾向把握に振っている。

Gemini API Managed Agents入門 — 1APIコールで自律エージェントを立ち上げる

Source: Qiita | Published: 2026-05-23 18:07 JST

Google I/O 2026で発表されたGemini API Managed Agentsを使い、1回のAPIコールでサンドボックス付き自律エージェントを立ち上げる手順を解説している。
ベースモデルはGemini 3.5 Flashで、コード実行（Bash/Python/Node.js）、ファイル操作、Google検索、URL取得、pip/npmでの動的パッケージ導入を標準サポートする。
約135,000トークンで自動的にコンテキスト圧縮が走り、environment_idを介してマルチターン会話やファイル・パッケージ状態を引き継げる仕組みになっている。
プレビュー期間中はコンピュートが無料、トークン課金のみ（1タスクあたり$0.30〜$3.25程度）で、内部のAntigravity 2.0と同じハーネスを外部公開した位置付け。
自前でサンドボックス・セッション・ツール調停を組む必要が消え、研究者・開発者がエージェント実装のボイラープレートを書かずに済むようになった。

OpenAI、業務用最高性能モデル「GPT-5.5 Instant」を発表

Source: Qiita | Published: 2026-05-23 06:00 JST

OpenAIがChatGPTのデフォルトモデルをGPT-5.2からGPT-5.5へ自動切替する形で「GPT-5.5 Instant」を投入した。
訴求点は複雑な目標理解・必要なツール選択・成果検証・多段階タスク完遂で、業務寄りのワークフロー置き換えを狙ったポジショニングである。
GPT-5.2比で推論力、コード生成精度、多段タスクの中断率の3点が改善されたとされる。
一方で詳細な技術ベンチマークや第三者検証は今回の発表には含まれておらず、業務導入前に各社で独自検証することを記事は推奨している。
価格や提供地域などの具体的な提供条件は公開されておらず、現時点ではChatGPT利用者が知らないうちに切り替わる形での提供にとどまる。

爆速自動化】AIに要望を言うだけでGoogleフォームを自動生成するGASツールを作ってみた【商用フリー】

Source: Qiita | Published: 2026-05-23 16:32 JST

自然言語の要望をAIに伝え、生成されたJSONをWebアプリに貼るだけでGoogleフォームを自動生成するGASツールを公開した。
専用プロンプトは「要件確認 → 確定 → JSON出力」の3段構成にし、AIがいきなりJSONを返して仕様ズレを起こすのを防いでいる。
対応コントロールはテキスト/段落/日付/時刻/評価尺度/ラジオ/チェック/プルダウン/セクション分岐と幅広く、正解付きのクイズモードも備える。
個人・社内利用は無料で改変も可能だが、再配布・転売・リブランディング・有償サービスへの組み込みは禁止と明記されている。
データ消失や障害は自己責任の前提で、フォームの中身は全てJSON仕様として残るためバックアップ・差分管理も自然に行える設計になっている。

Google CEO Pichai now calls links a “part” of search, redefining the web’s role in its own product（Google CEOピチャイ氏、リンクを検索の「一部」と表現し直し、自社製品でのウェブの役割を再定義）

Source: The Decoder | Published: 2026-05-23 18:16 JST

GoogleのSundar Pichaiがポッドキャストで「ソースとリンクは検索の『一部』として常に存在する」と述べ、リンクを検索の基盤から付随要素へと格下げした。
これは検索エンジンからAI回答エンジンへの転換と整合しており、Googleが自社UI内のAI生成回答を外部サイト誘導より優先している現状を追認する発言である。
結果として、出版社はAI回答に採用される「優先ソース」選定の中でしか可視性を確保できなくなり、トラフィック減と編集権の集中が進む構図になる。
記事はGoogleが中立的な情報仲介者から「どの声を載せるか決める出版者」に変質しているとし、共有された参照基盤が断片化する点を懸念している。
「Preferred sources」のようなユーザー選択UIも、実際の可視性はGoogleが裏側で握っており、透明性が逆に下がる方向に向かっていると指摘した。

Anthropic warns Claude Mythos Preview finds bugs faster than developers can patch them（Anthropic、Claude Mythos Previewが開発者の修正速度を上回るペースでバグを発見すると警告）

Source: The Decoder | Published: 2026-05-23 16:42 JST

Anthropicは「Claude Mythos Preview」と約50の提携先がProject Glasswingの一環として1か月で10,000件超の重大脆弱性を検出したと発表した。
うちオープンソースだけで1,000以上のプロジェクトから6,202件のhigh/critical脆弱性を検出し、独立レビューでも約90.6%が真の脆弱性と確認された。
Cloudflareでは2,000件、MozillaではFirefoxで271件（従来比10倍）など、インフラ系大企業（Palo Alto Networks、Microsoft、Oracleなど）で大量検出が起きている。
一方OSS側は対応が追いつかず、報告された1,596件の脆弱性のうち2026年5月時点でパッチ済みは97件にとどまり「見つかる速度＞直す速度」の危険な期間が生まれている。
Anthropicはパッチサイクル短縮、ロールアウト自動化、多要素認証、構成のハードニング、ロギング強化を推奨し、現在のセーフガードでは悪用を完全には防げないとも認めている。

GAS × Difyで問い合わせ分類AIを作る方法｜非エンジニア向け

Source: Zenn | Published: 2026-05-23 00:00 JST

Googleフォーム→スプレッドシート→GAS→Dify→スプレッドシート書き戻しというパイプラインで、非エンジニアでも組める問い合わせ分類AIを構築している。
Dify側のワークフローでカテゴリ（クレーム/依頼/問い合わせ）、優先度（高/中/低）、要約、返信ドラフトの4要素を構造化JSONで返す設計にしている。
生のGASでLLMを叩かずDifyを噛ませる理由として、プロンプトのコード分離、JSON出力の安定化、GUIによる業務側でのロジック改修容易性の3点を挙げる。
想定読者は問い合わせの内容確認・優先度判定・担当振り分け・返信作成を手作業でやっている非エンジニア部門で、IF文ベースの自動化が表現揺れに弱い問題を解決する。
著者は「AIをどう業務に組み込むか」が成否を決めると強調し、設計を誤るとPoCで止まり精度も安定しないと釘を刺している。

Microsoft MAI-Image-2 入門

Source: Zenn | Published: 2026-05-23 00:00 JST

Microsoftが2026年4月2日に公開したMAI-Image-2の特徴と、Microsoft Foundry API経由での使い方を入門としてまとめている。
Arena.aiのリーダーボードではFLUX1.1 [pro]、Midjourney V7に次ぐ3位で、Imagen 4より上位にランクされている。
強みは写実性（自然光・肌・環境）、画像内テキストレンダリングの正確さ、サーリアル/シネマティックな複雑シーン生成の3点。
入力は最大32,000トークン、出力は単一PNGで最大1024×1024（106万ピクセル）まで、前世代比2倍の生成速度。
価格は入力$5/1Mトークン、出力$33/1Mトークンで、1024×1024画像1枚あたり数セント程度に収まる料金体系となる。

【Irodori-TTS】DGX Spark (GB10) でOpenAI互換TTSサーバーを構築する

Source: Zenn | Published: 2026-05-23 00:00 JST

NVIDIA DGX SparkのGB10 GPU上に、/v1/audio/speechエンドポイントを備えるOpenAI互換の日本語TTSサーバー「Irodori-TTS」を構築する手順を解説する。
GB10はCUDA Compute Capability 12.1（SM_121）で、PyPI配布の標準PyTorchホイールと互換性がないため、torchaudio相当をsoundfile/scipy/PyTorchで置き換える最小shimを書いている。
動作要件はDocker、Docker Compose、NVIDIA Container Toolkit、約300GBのモデルキャッシュ用ストレージ、公開ポート8088。
リファレンス音声を渡せば声質を指定でき、WAV/FLAC/MP3など複数の入出力フォーマットに対応する。
初回リクエストでモデルダウンロードが走るが、ステップ数や音声ガイダンススケールを呼び出し側で設定でき、CLIからcurlだけで合成できる構成になっている。

【AI Build新シリーズ：第0回】Google I/Oで激変するAI開発！「おっちゃん」爆速エージェント化編、始動

Source: Zenn | Published: 2026-05-23 00:00 JST

Gemini APIで関西弁キャラ「おっちゃん」を題材に、Google I/O 2026後のAI開発スタイルを学ぶ新シリーズの第0回（イントロ）にあたる。
I/O 2026の3つの変化として、Gemini 3.5 Flashの応答4倍高速化、Managed Agentsによるサンドボックス自動化、Markdown（AGENTS.md/SKILL.md）でのキャラ・スキル定義を挙げる。
開発スタイルが「手でコードを書く」から「仕様書ベースでAIに指示する」へ移ることが、本シリーズ全体のテーマになっている。
全5回構成で、構成ファイルからのベースエージェント作成 → Web検索 → アップロードファイル上でのコード実行 → 外部API連携 → Cloud Run＋認証での全世界デプロイまでをカバーする。
すべてGoogle Cloudの無料枠で完結する前提で、エージェント開発のハードルを下げることを明示している。

Googleの奇才、デミス・ハサビスを解剖する

Source: Zenn | Published: 2026-05-23 00:00 JST

Google DeepMind CEOのDemis Hassabisがチェス → ゲーム開発 → 神経科学 → DeepMind創業と一貫した知能観で歩んできた軌跡を整理している。
AlphaGo（2016年）では価値ネットワーク（直感）と方策ネットワーク＋木探索（熟考）の分離・統合により欧州王者を破った点を「方法論の発明」と位置付ける。
AlphaFold（2020–21）はタンパク質構造予測を計算問題化し、2億超の構造データベースを生み、Hassabisと John Jumper を2024年ノーベル化学賞へ導いた成果として紹介する。
AlphaGeometry / AlphaProof、気象予測、アルゴリズム最適化への展開を、すべて「組合せパズルとして仮説生成と検証を回す」共通方法論で説明している。
「知能とは自然現象を予測装置に圧縮すること」という思想と、評価可能な問題選び・反復ループ整備・成果のツール化が現代AI研究の基盤になっていると結論付けている。

AI-900を生成AIだけで突破した話

Source: Zenn | Published: 2026-05-23 00:00 JST

教材を購入せずChatGPTのみでMicrosoft AI-900（Azure AI Fundamentals）に合格した受験記である。
鍵となったのはメタプロンプト方式で、まず「AWS SAA相当の前提知識」「章ごとに小分け配信」などの条件で最良の学習プロンプト自体をAIに設計させている。
出来上がったプロンプトを別チャットに貼り直してから、学習本編を開始するという2段構えで指示の精度を担保した。
工夫として「S3 ≒ Azure Blob Storage」などAWSとの対照表で説明させ、章末クイズや擬似ビジュアル（テキスト図）で集中力切れを防いだ。
教科書ベースより効率的だったと結論しているが、具体的な得点や学習時間などの数値は記事内では言及していない。

LINEから始まるAI共生メモ環境（Obsidian × Google Drive × GitHub）

Source: Zenn | Published: 2026-05-23 00:00 JST

個人LINEに送ったメッセージをGoogle Apps Scriptで受け取り、Google Drive上の月別Markdownファイルに自動追記するメモ環境を構築している。
設計コンセプトは「スマホで素早くインプットし、PCを開いた時にそのまま続きをやれる」ことで、人間用ツールとAI用環境を意図的に分離している。
Drive側に貯めた文章はGeminiなどのAIから直接参照可能で、ObsidianとGitHubは閲覧・整理側のフロントとして使い分けている。
GASがスプレッドシートをキューにして1分ごとにバッチでDrive書き込みを行い、Webhookの重複処理やリトライにも耐えるようにしている。
公式Obsidian同期サービスを使わずに、iOS/Android/Windows間でMarkdown中心の同期を実現している点が実装上のポイントとなる。

スマホからGeminiのサポートを受けてデータ分析する〜 AI.AGG関数で各国のGoogleトレンドを分析する〜

Source: Qiita | Published: 2026-05-23 20:29 JST

BigQuery Studio上のAI.AGG関数を、PC不要でスマホから呼び出して各国Googleトレンドを要約させる実験記事である。
AI.AGGはGROUP BYで集約されたデータに対して内部的に多段生成を行うため、AI.GENERATE_TEXTでは入りきらない大量データの要約に向く。
操作はクエリタブの鉛筆アイコンからGemini連携を呼び出し、自然言語で目的を伝えてSQLを生成・修正し、結果をGoogleスプレッドシートに書き出して閲覧する流れになる。
出力例として、日本は野球と芸能、オーストラリアは生活費と複数スポーツ、英国はF1・サッカー・政治経済など、国別の関心傾向が言語化されている。
AI.AGGは2026年4月13日に一旦取り下げられ5月20日に再公開された経緯があり、スマホ運用のセキュリティ・コスト面のリスクも併せて指摘している。

Image 2 でブランドモックアップセットを約10分で生成する手順

Source: Qiita | Published: 2026-05-23 21:04 JST

OpenAI Image 2に背景透過PNGのロゴ1枚を渡し、ブランドモックアップ一式を約10分で作る手順を紹介している（従来手法では半日程度かかっていた作業）。
カバーする成果物はロゴバリエーション、名刺/封筒など個別グッズ、マテリアルセット、空間/環境シーン、人物が製品を使う場面、Instagram/X用のSNSビジュアルの6カテゴリ。
手順は「企画プロンプトを渡してカテゴリ別プロンプト＋推奨アスペクト比をImage 2に生成させる → そのプロンプトを順に実行する」という2段構成にしている。
生成精度向上のコツとして、ロゴは必ず背景透過PNGを使うことを強調している。
価格や他ツール（Midjourney、FLUXなど）との比較には踏み込んでおらず、Image 2単体のワークフロー紹介に絞っている。

【特化型 ②】コホート/ケースコントロール研究のスライドを一発生成する──NotebookLM注入プロンプト

Source: Qiita | Published: 2026-05-23 13:33 JST

疫学のコホート/ケースコントロール研究論文をNotebookLMに読み込ませ、11〜12枚構成の発表スライドを一発生成するための特化型プロンプトを公開している。
スライド構成は「背景・目的1〜2枚 → 方法3〜4枚 → 結果3〜4枚 → 考察1枚 → 限界・結論1枚」と固定されており、専門領域での型を意識した分量配分になっている。
抽出を強制する数値項目として、ハザード比・オッズ比・相対リスクとP値、Cox回帰・ロジスティック回帰・傾向スコアマッチング、交絡因子の調整方法、追跡期間などを挙げる。
ワークフローを「抽出 → スライド整形 → 生成」の3段に分け、ステップ1の抽出結果を人が検証してから次に進められる設計でハルシネーションを減らす。
著者は社外配布前に論文のOpen Accessステータス確認を必須とし、医療従事者・研究者の発表準備を高速化する用途を想定している。

[Codex実録] AIエージェントと作るWebサイト

Source: Zenn | Published: 2026-05-23 00:00 JST

記念品買取の「20%増額キャンペーン」LPを、既存ホームページに手を入れずCodexと共同で構築した実録記事。
Codexはルーティング一体型と独立ページ型の選択肢を提示し、src/lpo/配下に置く拡張しやすいフォルダ構成を提案した。
初回生成でヒーローの20%訴求、100% vs 120%の評価比較表、関係/冒険/仕事の3カテゴリ提示、査定フロー、FAQ、CTAまで揃ったLPがほぼそのまま使える品質で出力された。
CTAコピーは汎用表現ではなく「20%増額査定スタート」のような訴求の強い表現にCodex側が書き換え提案を行い、設計議論の相手として機能した。
詰まりどころはViteのSPAフォールバックでHTMLエントリに直接アクセスできない件で、原因が分かれば致命傷ではなく学びになる程度の問題で済んだ。

土木事業管理における知識・判断継承のためのRAGシステム構築提案書（素案）

Source: Zenn | Published: 2026-05-23 00:00 JST

土木事業の知識・判断を継承するため、GraphRAG・VectorRAG・CogGRAG・ドメインオントロジーを組み合わせたハイブリッドRAG構成を提案している。
GraphRAGで河川法・道路法などの規制と手順の関係性をグラフ化し、VectorRAGで非構造の報告書・事例の類似検索を担当させる。
CogGRAGで複雑な問い合わせを専門家の思考プロセスに似た推論連鎖へ分解し、オントロジーで土木固有の概念・略語・推論規則を形式化する。
想定ユーザーは現場の事業管理・技術監督部門の意思決定者と技術スタッフで、データソースは法令・基準・施工報告・トラブル事例まで広く取る。
期待効果は、回答が必ずグラフノードを根拠として引用するハルシネーション抑制、2ホップ以上の規制連鎖の自動追跡、用語統一、ドキュメント追加が日単位ではなく時間単位で反映できる更新性。

Gemini API の不正利用を検知する7つの方法

Source: Zenn | Published: 2026-05-23 00:00 JST

Gemini API（generativelanguage.googleapis.com）の不正利用を防ぐため、静的・動的・事後の3観点で7つの検知手法を整理した実践記事。
静的側はAPIキー棚卸し（無制限キーの抽出）と、GitHub Secret Scanning＋Push Protection、TruffleHog --only-verified、pre-commit hookによる多層のシークレットスキャン。
動的側はCloud Monitoringでrequest_countをcredential_id別に監視し、平常時2倍で警告・5倍でクリティカル、予算アラートは50/90/100%の段階設定を推奨する。
AI Studioの予算上限は反映に約10分のラグがあるため、その間にリクエストが通り続ける脆弱性ウィンドウを認識しておく必要がある。
事後対応はBilling → メトリクス → 監査ログ → GitHub/TruffleHog → ファイルアクセスログの順で追跡し、2026年6月19日以降は無制限APIキー自体がGoogle側でブロックされる点も明記している。

All Articles

Zenn

#	Title	Summary	Author	Published
1	Claude のセッション活用術〜記憶の仕組みと使い分け方	Claudeのセッション境界をまたぐ記憶の持ち方を整理し、用途別にチャット型・プロジェクト型・スキル型をどう使い分けるかを提案している。	レイン│Claudeラボ	2026-05-23 00:00 JST
2	「正しいモデル」とは何か — Code with Claude London 2026 で考え方が一段アップデートされた話	Code with Claude London 2026に参加して得た「タスク別に最小モデルから試す」というモデル選択原則を、自分の意思決定プロセスに落とし込んでいる。	noah	2026-05-23 00:00 JST
3	AIコーディングエージェントの本当の攻撃面は設定ファイルだった	Claude CodeやCodexの真の攻撃面は実行コードではなくAGENTS.md等の設定ファイル側にあると指摘し、レビュー対象を再定義している。	Justin	2026-05-23 00:00 JST
4	Claudeによるマネジメントをちょっと楽にする方法	1on1メモや週報など定型マネジメント業務をClaudeに整形させ、判断系の意思決定だけ人間に残す運用フローを紹介している。	Takuma Kouno	2026-05-23 00:00 JST
5	Claude Mythosを使っても日本の金融機関は絶対にセキュリティを強化できない	Claude Mythosの脆弱性検出力があっても、稟議・委託契約・パッチ展開の遅さがボトルネックになり日本の金融機関では結局活かしきれないと論じている。	トンヌラ	2026-05-23 00:00 JST
6	君は「Fact-Forcing Gate」を知っているか — Claude Code でAIに事実を申告させるHook	Claude Codeのhookで「根拠ファイルパスと行番号を必ず申告させてから出力する」Fact-Forcing Gateを実装し、嘘発言を構造的に減らしている。	kobarutosato	2026-05-23 00:00 JST
7	AIに『お願い』から『委譲』へ：エージェント時代のプロンプト設計ノート	プロンプトを単発のお願い文ではなく、責任範囲と判断基準を渡す「業務委譲書」として設計する考え方を、エージェント時代に向けて整理している。	じゅん	2026-05-23 00:00 JST
8	【注意喚起】Claude Code に .claudeignore は存在しない（効かない）	Claude Codeには`.claudeignore`という仕組みは存在せず、`settings.json`のpermissions側で除外指定を行う必要があると検証つきで指摘している。	catsnipe	2026-05-23 00:00 JST
9	Claude Code / MCPで学んだ、AIが迷わない知識設計とツール設計	Claude CodeとMCPの実装経験から、AIが迷子にならないために知識粒度・ツール責務・命名規則をどう揃えるべきかを整理している。	TH	2026-05-23 00:00 JST
10	Karpathy CLAUDE.mdは本当に普遍解か？	Karpathy流のCLAUDE.md構成をそのまま流用すると過剰指示で逆効果になる場面があり、プロジェクト要件に合わせて削るべきだと主張している。	みーた	2026-05-23 00:00 JST
11	自律タスク実行システムの本体は「止まり方」だった	自律ループ型エージェントを長時間動かしてみた結果、性能差より「いつ止めるか・どう止めるか」の終了条件設計が安定運用の本丸だったと結論している。	takamasa_aiso	2026-05-23 00:00 JST
12	LLMはあなたの階級をみている——言語スタイルが呼び起こす文化的重力の実験記録	同じ質問でも敬語/方言/俗語など言語スタイルを変えると、LLMが想定する話者階層に応じて回答内容や態度が変化することを実験で示している。	blue_sunset	2026-05-23 00:00 JST
13	この春、生成AIへの入力をキーボードから音声に変えた話	入力をキーボードから音声へ切り替えたところ、思考の粒度がブロック単位に変わり、AIへの依頼がより会話的になったと報告している。	i.i	2026-05-23 00:00 JST
14	独立コンテキストの subagent には grill-with-docs を渡せ	親と独立したコンテキストを持つsubagentには、関連ドキュメントを焼き込んだ「grill-with-docs」型の入力を渡すと品質が安定すると述べている。	安並大智	2026-05-23 00:00 JST
15	worktree の『バトンタッチ』問題を、自前 skill・Codex・Augment で比べて反省した	git worktreeでエージェント間に作業を引き継ぐ際の前提共有問題を、自前skillとCodexとAugmentで比較し、どこで崩れるかを反省している。	安並大智	2026-05-23 00:00 JST
16	AI Native時代とは何か｜「AIを使う」から「AI前提で業務を作る」へ	AI Nativeを「既存業務にAIを足す」発想ではなく「AIが常駐する前提で業務プロセス自体を再設計する」状態と定義し直している。	zero-one-tech	2026-05-23 00:00 JST
17	運用・保守チームと語らずに、移行設計はできない	システム移行設計で開発側だけで結論を出すと運用面で破綻するため、運用・保守チームとの対話を初期段階から組み込むべきだと提言している。	現役PMO／AI協調設計の実践者	2026-05-23 00:00 JST
18	猫2匹を見分けるカメラを作る (1)	自宅の猫2匹を判別する家庭用カメラを題材に、データ収集と前処理から始める個体識別パイプラインの第1回を解説している。	kensaku.a.amamiya	2026-05-23 00:00 JST
19	トークン84%減 + 長時間連続自走を実現したAIワーカー	Codex CLIのサイクル運用とコンテキスト整理により、従来比トークン84%削減と長時間連続自走を両立したAIワーカーの構成を共有している。	Tom	2026-05-23 00:00 JST
20	「AIに丸投げ」が失敗する理由	AIに業務を丸投げして失敗する典型例として、要件未定義・検証なし・責任不明の3パターンを挙げ、人が握るべき工程を再整理している。	ふみ_BENTEN WebWorks	2026-05-23 00:00 JST
21	コンテキストエンジニアリングは7要素の組み合わせ	コンテキストエンジニアリングを目的・役割・知識・道具・履歴・出力形式・制約の7要素に分解し、構成図として全体像を提示している。	井本賢	2026-05-23 00:00 JST
22	MCPを使う前に知っておくべきこと——便利さの裏にある攻撃の仕組み	MCPサーバーが間接プロンプトインジェクションや権限昇格の入口になり得る仕組みを整理し、導入前に確認すべきセキュリティ観点を示している。	増田	2026-05-23 00:00 JST
23	No disclaimer by designという考え方	エージェントの応答末尾に都度の免責文を吐かせず、「免責は仕様書側で固定する」というNo disclaimer by designの設計思想を提案している。	mofuteq	2026-05-23 00:00 JST
24	Gemma 4 搭載の小説執筆AIエージェント【NovelPilot】	Gemma 4をベースに、章構成・キャラ管理・伏線回収を担当エージェントへ分割した小説執筆支援システムNovelPilotを公開している。	Doraking	2026-05-23 00:00 JST
25	セルフホスト可能なLLMについて調査した！	セルフホスト可能な主要LLMをライセンス・必要VRAM・推論サーバー対応の観点で比較し、用途別の選択基準を一覧化している。	たっしー	2026-05-23 00:00 JST
26	RoPEとは？Attentionに位置差を入れる仕組み	TransformerのAttentionに相対位置情報を埋め込むRoPE（Rotary Position Embedding）を、回転行列としての直感から数式まで段階的に解説している。	kas’s blog	2026-05-23 00:00 JST
27	検索エンジンvsAI論争が見落としていること	検索エンジン対AIの議論は「リンクとサマリーのどちらを返すか」ではなく「誰が一次情報の責任を負うか」が焦点だと再整理している。	増田	2026-05-23 00:00 JST
28	AI共創：3.5Flashの本能の挙動観察記録	Gemini 3.5 Flashと長期対話する中で観察された、指示なしでも繰り返される構文・出力選好を「本能的挙動」として記録している。	田栄人	2026-05-23 00:00 JST
29	HiDream のぽん出し → Dev に逃げる → VRAM が破綻 → プロンプトで殴って勝った話	画像生成HiDreamでDevモデルに切り替えてVRAMが破綻した際、プロンプト圧縮と段階生成で乗り切った試行錯誤の記録である。	zhner	2026-05-23 00:00 JST
30	Gemini 3.1 Proで作る「心」と「記憶」を持つ完全自律型AIパートナー	Gemini 3.1 Proに長期記憶ストアと感情ステートマシンを組み合わせ、放置しても自律的に振る舞うAIパートナーを構築した事例を紹介している。	Mikity	2026-05-23 00:00 JST
31	Gemini for Scienceとは？今後の社会的意義を考える	Gemini for Scienceの位置付けを整理し、生命科学・気象・材料探索といった分野へ与え得る波及効果を社会的意義の観点から考察している。	SØNDER 01	2026-05-23 00:00 JST
32	Gemini Groundingが高すぎた話。月1,000回無料のTavily APIで競合監視と営業DXを激安で実現した	Gemini Groundingの課金が想定を超えたため、月1,000回無料のTavily APIへ差し替えて競合監視と営業DXを大幅に低コスト化したと報告している。	miki-mini	2026-05-23 00:00 JST
33	LLMの出力を安定させたい｜ note2Zenn開発記（LLM編 / Vol.4）	noteからZennへの記事変換ツールを作る中で、LLM出力のブレを抑えるためにJSON Schema＋自動リトライを組み合わせた設計を解説している。	hanav1ye	2026-05-23 00:00 JST
34	バイブコーディングは、すべてのPC作業に使える	バイブコーディングは開発だけでなく、Excel処理やドキュメント整形などPC作業全般に適用できる思考様式だと主張している。	BittensorMan	2026-05-23 12:59 JST
35	手入力をなくすことは、システム内製化の入口	部署内に残る手入力業務をAI＋スクリプトで自動化することが、内製化文化を社内に根付かせる最も低コストな入口になると説いている。	BittensorMan	2026-05-23 12:59 JST
36	Claude CodeのオートモードがProに来た。個人開発の「ひとりチーム化」がまた進む	Claude CodeのオートモードがProプランで解禁され、個人開発者がレビュー役と実装役を1人で兼ねる「ひとりチーム化」がさらに進むと評価している。	剛｜生成AI×アプリ開発	2026-05-23 12:54 JST
37	Mac mini M4 Pro 48GBでローカルLLM比較	Mac mini M4 Pro 48GBで主要なローカルLLMを実測し、速度とメモリ消費の傾向、推奨モデル/量子化設定を比較している。	mt	2026-05-23 10:05 JST
38	PTAのwebサイトを0円・誰でも運用できる構成にリニューアルした話①設計編	PTAのWebサイトを誰でも引き継げる0円構成（静的サイト＋Git＋AI支援運用）に作り直す設計編で、引継ぎ容易性を最優先に置いている。	norio	2026-05-23 07:50 JST
39	#0 vibe codingで日本株自動売買システムを作ってみた	バイブコーディングで日本株の自動売買システムを試作したシリーズの第0回で、構成方針と検証範囲を提示している。	ゆーいち	2026-05-23 00:00 JST
40	SessionStartフックでClaude Code CLIを自動構成する実践	Claude Code CLIのSessionStartフックを使い、プロジェクトごとの環境変数・MCPサーバー・許可コマンドをセッション開始時に自動構成する実装を共有している。	fukukei23	2026-05-23 00:00 JST
41	Claude CodeとBLEの闇を20分掘った話	Bluetooth Low Energy仕様の曖昧な領域を、Claude Codeと20分対話するだけで仕様書の根拠付きで詰めていけた体験記である。	h_h	2026-05-23 00:00 JST
42	AIエージェントに「説明文」ではなく「想起文」を渡してみる	エージェントに渡すコンテキストを通常の説明文から、過去の体験を想起させる「想起文」に変えた方が、人格と判断の一貫性が高まると報告している。	超伝導ババア	2026-05-23 00:00 JST
43	WindowsでClaude Codeを使う	Windows環境でClaude Codeを動かす際のWSL構成、PATH設定、シェルプロファイル統合までの手順をまとめている。	chimamyo	2026-05-23 00:00 JST
44	Claude Codeのコンテキスト枯渇に立ち向かう	長時間セッションでClaude Codeのコンテキストが枯渇する問題に対し、要約スキル・サブエージェント分業・履歴外出しで戦う実践策を提示している。	dtakamiya	2026-05-23 00:00 JST
45	Claude Code のレート制限、頭で算盤やめろ。二段バーが羅針盤になる	Claude Codeのレート制限を直感的に把握するための「二段バー」可視化を導入し、暗算に頼らない運用に切り替えた事例を紹介している。	船長	2026-05-23 00:00 JST
46	Claude Code はじめてのハンズオン	初学者向けに、Claude CodeのインストールからCLAUDE.md設計、簡単な実装演習までを段階的に体験できるハンズオン本を公開している。	サクッとぱんだ	2026-05-23 00:00 JST
47	LINEから始まるAI共生メモ環境（Obsidian × Google Drive × GitHub）	LINEを入口にしてDriveに蓄積し、ObsidianとGitHubを閲覧フロントとして使うAI共生メモ環境を構築している。	け	2026-05-23 00:00 JST
48	アインシュタインのAIに「AIの危険性」を講演させたら…	アインシュタイン人格を再現したAIにAIの危険性について講演させた実験で、史実の人物視点がどこまで現代AI論を語れるかを観察している。	片倉慶孝	2026-05-23 00:00 JST
49	今更聞けないRAG入門 2026版	2026年時点のRAG構成（Hybrid検索・Rerank・GraphRAG・Long Context併用）を踏まえて、入門者向けに最新の全体像を改訂版として解説している。	highThreee	2026-05-23 00:00 JST
50	AIエージェントに「制御部品」が必要になる理由	AIエージェントには判断ロジックだけでなく、停止条件・権限ゲート・ループ抜けなどの「制御部品」を明示的に組み込む必要があると主張している。	muchugabu	2026-05-23 00:00 JST
51	Agentは構造で考え、構造を見せずに返す	エージェントは内部では構造化された思考を持ちつつ、最終出力では構造を見せず自然文で返すべきだという設計指針を提示している。	mofuteq	2026-05-23 00:00 JST
52	AIにMarkdownを書かせたあと、誰がそれを読むのか	AI生成のMarkdownを「人間が読む」のか「別のAIが読む」のかで構造化粒度を変えるべきで、両者を混在させると運用が破綻すると指摘している。	53able	2026-05-23 00:00 JST
53	Dockerを手放したら、Agent開発が身軽になった	エージェント開発からDockerを外して直接ローカル環境で回すようにしたら、起動コストが下がりイテレーション速度が上がったと報告している。	mofuteq	2026-05-23 00:00 JST
54	Agent Runtimeを作っていたら、State Machineと再会した	Agent Runtimeを自作する過程で、ツール呼び出し・割り込み・再開の制御が結局State Machineに収束すると気づいた経緯を共有している。	mofuteq	2026-05-23 00:00 JST
55	[Mastra YouTube 解説] 型付きSDKでMCPサーバーを作り直すという提案	MastraのYouTube解説をもとに、現在JSONベースで書かれがちなMCPサーバーを型付きSDKで再実装する利点と移行案を整理している。	jun shiromizu	2026-05-23 00:00 JST
56	AIの提案にユーザーが同意した証跡を残すMCPを作った	AIの提案に対するユーザー同意の有無と内容を、後から再現可能な形で記録する専用MCPサーバーを自作・公開している。	abalol	2026-05-23 00:00 JST

Qiita

#	Title	Summary	Author	Published
1	Python + Discord.py でマルチLLMエージェントチームを作った設計とハマりポイント	Discord上にClaude8体＋GPT-5.5を1体並べた9人のAI社員チームを構築し、役割分担・割り込み・履歴共有の設計上のハマりどころを共有している。	ai_nowa	2026-05-23 21:36 JST
2	Claude Code で『仮想組織』を 2 週間運用してわかった、サブエージェント設計の地雷 5 つ	Claude Codeで仮想組織を2週間運用してわかった、責任境界の曖昧化や履歴爆発などサブエージェント設計の地雷5つを具体例つきで整理している。	vincentmango_wen	2026-05-23 18:04 JST
3	Claude Code の PreToolUse / permissions / protected paths の関係メモ	Claude CodeのPreToolUseフック・permissions・protected pathsがどの順番でツール実行を許可・遮断するか、評価順序を整理した技術メモである。	KWS_0901	2026-05-23 13:24 JST
4	【2026年度版】Codex CLIをコードレビュー用途で使う方針まとめ	Codex CLIをコードレビュー専任で運用するための、対象ファイル指定・観点プロンプト・指摘の永続化までを2026年度版方針としてまとめている。	honda-dev-jp	2026-05-23 22:53 JST
5	Midnight AI Groove 26-05-11	業界センチメントと当日のAIニュースを、深夜帯らしい対話形式でゆるく振り返るコラム的記事である。	masykot582	2026-05-23 22:34 JST
6	jetfitでJetson上のLLM選びの迷いを一掃するかも？	NVIDIA Jetsonデバイスの統合メモリ・帯域制約を踏まえ、動かせるLLMを一覧化・推薦する専用ツールjetfitを紹介している。	mannsub	2026-05-23 21:15 JST
7	Gemini 3.5 FlashをMLエンジニアが試したらコーディング速度がこう上がった	MLエンジニアがGemini 3.5 Flashを実装作業に使い、設計→実装→修正のサイクル時間がどう短縮されたかを実測ベースで報告している。	yukiwill0012	2026-05-23 20:42 JST
8	【Agent万能説】エージェントで会社をつくったら現実と同じ課題があがってきた件	複数AIエージェントで仮想会社を運用したところ、人間組織と同じく責任分担・優先順位調停・コミュニケーション過多の問題が再現されたと報告している。	charge0315	2026-05-23 14:09 JST
9	Codex v26.519 新機能ガイド — Appshots・ロック中Mac操作・Goal Mode正式版の全貌	Codex v26.519のApppshots（Macウィンドウ送信）、ロック中Mac操作、Goal Mode正式版を中心に、新機能の挙動と設定をまとめている。	kai_kou	2026-05-23 18:07 JST
10	自分の文脈で多角的にニュースを語る「News Prism」を Bedrock で作った話	個人の関心・経歴という「自分の文脈」を踏まえ、同じニュースを複数視点で要約する社内向けツールNews PrismをAWS Bedrockで構築している。	tadokoro88	2026-05-23 16:12 JST
11	爆速自動化】AIに要望を言うだけでGoogleフォームを自動生成するGASツールを作ってみた【商用フリー】	AIに自然言語で要件を伝えるだけで、テキスト/評価/分岐などを含むGoogleフォームをGASが自動生成する無料ツールを公開している。	gomadanngo	2026-05-23 16:32 JST
12	騙されても被害が出ない——間接プロンプトインジェクションを止める実装の芯【中編】	EchoLeak脆弱性を踏まえ、間接プロンプトインジェクションはAIの弱点ではなく権限境界・出力検査・実行ゲートの設計で潰すべきだと論じている。	mhamadajp	2026-05-23 04:57 JST
13	OCI の Personal Access Token は 60 分超を指定しても 60 分で切れる	OCI Database Tools MCP ServerをClaude Desktopに繋いだ際、PATを60分超に設定しても実態は60分で切れる挙動を再現条件つきで報告している。	asahide	2026-05-23 21:40 JST
14	「いま重い SQL を 3 件教えて」を OCI Database Tools MCP Server に聞いてみた	OCIのNL2SQLとDatabase Tools MCP Serverに「重いSQLを3件挙げて」と問い、応答内容・SQL生成・根拠提示の差を比較している。	asahide	2026-05-23 16:09 JST
15	Claude Agent SDK MCPサーバーのセキュリティ設計5軸	Claude Agent SDKでMCPサーバーを実装する情報セキュリティチーム向けに、認証・認可・入力検証・出力検査・監査の5軸で設計指針を整理している。	drasenas	2026-05-23 13:39 JST
16	【個人開発】スキーマ設計不要で自然言語をそのまま保存する「intentdb」を自作しました	スキーマ設計や型定義を必要とせず、自然言語のまま保存・検索・更新できる個人開発DB「intentdb」を実装し、使用例を示している。	zzzzico	2026-05-23 12:13 JST

ITmedia AI+

#	Title	Summary	Published

対象日（2026-05-23 JST）に該当する記事はありませんでした。

GIGAZINE

#	Title	Summary	Published

対象日（2026-05-23 JST）でAI関連の記事はありませんでした。

Publickey

#	Title	Summary	Published

対象日（2026-05-23 JST）に該当する記事はありませんでした。

OpenAI Blog

#	Title	Summary	Published

対象日（2026-05-23 JST）に該当する記事はありませんでした。

Google AI Blog

#	Title	Summary	Published

対象日（2026-05-23 JST）に該当する記事はありませんでした。

Hugging Face Blog

#	Title	Summary	Published
1	Towards Speed-of-Light Text Generation with Nemotron-Labs Diffusion Language Models（Nemotron-Labs拡散型言語モデルによる光速級テキスト生成へ）	NVIDIA Nemotron-Labsが拡散型の言語モデル群を公開し、自己回帰型に対する高速テキスト生成のアプローチとして光速級のスループットを目指していると説明している。	2026-05-23 09:02 JST

Simon Willison

#	Title	Summary	Published

対象日（2026-05-23 JST）に該当する記事はありませんでした。

The Decoder

#	Title	Summary	Published
1	One of the world’s top law schools draws a hard line against AI in legal education（世界トップ法科大学院、法学教育におけるAI使用に厳格な線引きを表明）	UC Berkeley Lawが2026年夏学期から成績付き課題でのAIツール使用をほぼ全面禁止し、研究用途のみ許可する方針を打ち出したと報じている。	2026-05-23 19:55 JST

Hacker News

#	Title	Summary	Published

対象日（2026-05-23 JST）に該当する記事はありませんでした。