AI News Digest: 2026-05-05
Top 20
Anthropic、Blackstoneらと新会社設立へ 中小企業へのClaude導入を加速
Source: ITmedia AI+ | Published: 2026-05-05 07:00 JST
- AnthropicがBlackstone、Hellman & Friedman、Goldman Sachsを中核投資家に総額15億ドル規模の新合弁会社を設立すると発表した。
- 出資内訳はAnthropic・Blackstone・Hellman & Friedmanが各3億ドル、Goldman Sachsが1億5,000万ドルで、Apollo・General Atlantic・GIC・Sequoia Capitalも参加する。
- 銀行・医療システム統合企業など大規模組織を対象に、Accenture・Deloitte・PwCら既存Claude Partner Networkと連携してカスタマイズ・導入支援を提供する。
- OpenAIも並行してBain Capital等とエンタープライズ向け新会社「The Development Company」設立を進めており、AI二強がデプロイ商社化を競う構図が鮮明になった。
- 発表自体は2026年5月4日付で、ITmediaは翌5日に日本語解説記事として公開した。
GPT-5.5 Instant: smarter, clearer, and more personalized
Source: OpenAI Blog | Published: 2026-05-05 19:00 JST
- OpenAIがChatGPTのデフォルトモデルをGPT-5.5 Instantに切り替え、医療・法律・金融など高リスク領域でハルシネーション(根拠なき主張)を52.5%削減したと発表した。
- 内部テストでは過去にエラー指摘があった会話の不正確発言が37.3%減少、AIME 2025は65.4%→81.2%、GPQAは78.5%→85.6%、MMMU-Proは69.2%→76.0%にスコアが伸びた。
- 新機能「Memory Sources」は応答に影響した過去チャット・保存メモ・アップロードファイルを表示し、ユーザーが無関連エントリを削除・編集できる。
- ロールアウトはPlus/Proユーザーから即時開始、Free/Go/Business/Enterpriseには数週間内に段階展開される。
- 過去のGPT-5.3 Instantより冗長性・絵文字・不要なフォロー質問を抑え、トーンを整理した。
GPT-5.5 Instant System Card
Source: OpenAI Blog | Published: 2026-05-05 19:00 JST
- GPT-5.5 Instantリリースに合わせ、評価方法と安全対策を整理したSystem Cardを公開した。
- ハルシネーション低減・パーソナライズ強化と並ぶ主要訴求は「高リスク領域での主張削減」で、本体ブログとセットで読む補助文書という位置付け。
- ベンチマーク詳細・安全評価レッドチーミングなど、本体記事に書かれない技術深度の根拠資料がここに集約される設計。
- リリース日とロールアウト範囲はGPT-5.5 Instant本体と同日扱い。
- 本体記事と同じ
openai.com/index/配下で公開され、開発者向けの一次情報として位置付けられる。
Amazon brings agentic fine-tuning to SageMaker with support for Llama, Qwen, Deepseek, and Nova
Source: The Decoder | Published: 2026-05-05 19:08 JST
- Amazon SageMaker AIに「Amazon Kiro AI agent」を標準搭載し、自然言語の指示だけで言語モデルのファインチューニングを進められるようにした。
- 対応モデルはLlama・Qwen・Deepseek・Amazon Nova、ユーザーはClaude Codeなど他エージェントの利用も可能。
- ワークフローは9つのスキル(データセット確認・トレーニング方法推奨・データ準備・トレーニング実行・Jupyter形式コード生成・モデルデプロイ等)で構成され、各工程をエージェントが自動化する。
- 開発者は「プレーンランゲージで使用例を説明する」だけで、システムが適切なトレーニング方法を推奨し、データを準備する仕組み。
- 単独製品ではなくSageMaker内の機能追加として位置付けられ、複数のオープンウェイトモデル横断で利用できる。
datasette-llm 0.1a7
Source: Simon Willison | Published: 2026-05-05 10:56 JST
- Simon Willison氏がDatasette向けLLM統合の基盤プラグインdatasette-llm 0.1a7をリリースした。
- 新たに「特定モデルへのデフォルトオプション」を設定する仕組みが追加され、enrichment操作で例えばtemperature=0.5を一括指定できる。
- 他のDatasetteプラグインがLLMを呼ぶ際の依存基盤として機能し、設定の重複を1箇所に集約する役割を担う。
- 個別プラグインがプロンプト変数とデフォルトオプションを共有しやすくなることで、Datasette上のAI機能群の運用負荷を下げる。
- バージョンはアルファ(0.1a7)段階で、Datasette LLMエコシステム全体の前提依存として位置付けられている。
llm-echo 0.5a0
Source: Simon Willison | Published: 2026-05-05 10:31 JST
- llm-echo 0.5a0は「実際にLLMを呼ばずに入力をエコーする偽モデル」プラグインで、テスト用途に特化した更新が入った。
- 新オプション
-o thinking 1は標準エラーに推論ブロックを出力してから、JSONで入力をエコーバックする。 - 動作にはLLM本体の0.32a0以降が必要で、
uvx --with llm==0.32a1 --with llm-echo==0.5a0 llm -m echo hi -o thinking 1が公式の実行例として示された。 - 自動テスト作成や、thinking対応UIの動作確認に使うことが想定されている。
- LLM CLI/SDKの本体0.32系列開発と歩調を合わせ、thinkingブロックの取り回しを検証できるようになった。
MCP Apps入門 — AIチャットにインタラクティブUIを埋め込む公式拡張仕様の実装ガイド
Source: Qiita | Published: 2026-05-05 18:12 JST
- Model Context Protocolに初の公式拡張仕様「MCP Apps」(SEP-1865)が2026年1月26日に追加され、AIチャット内にHTMLベースの対話UIを埋め込めるようになった。
- 対応クライアントはClaude / Claude Desktop / VS Code GitHub Copilot / ChatGPT / Goose / Postman / MCPJamで、グラフ・ダッシュボード・フォーム・PDF・地図・Three.jsの3D・楽譜表示・リアルタイム監視UIなどを配信できる。
- セキュリティはサンドボックスiframeでDOM/Cookieアクセスをブロック、CSPメタデータでサーバが許可ドメインを宣言し、未宣言の通信はホスト側で遮断、View↔Server通信はpostMessage JSON-RPC経由で監査可能。
- サーバ側は
registerAppTool(server, "show_dashboard", { _meta: { ui: { resourceUri: "ui://dashboard/app.html" } } }, ...)の形でUIリソースを宣言する。 - 既存MCPがテキスト・構造化データのみだった構造から
ui://スキームによるUI配信とpostMessage双方向通信が加わるのが核となる差分。
中堅・中小企業に最も人気のAIエージェントは? Google Agentspaceは2位
Source: ITmedia AI+ | Published: 2026-05-05 08:00 JST
- ノークリサーチ「2025年 中堅・中小企業のIT、アプリケーション活用状況と経営ニーズ」(2025年7-8月、約1,300社調査)を引き、AIエージェント導入実態の調査結果を紹介した記事。
- Google Agentspaceは2位にランクインしたが、1位・3位の具体名は本文では明示されていない。
- 同調査ではノンコード/ローコード開発、RPA、AIエージェントの3カテゴリの導入傾向を比較している。
- RPAは「導入のハードルが高い」と課題視され、ノンコード/ローコード環境への移行が推奨ルートとして提示された。
- 「中小企業がITツールに拠出する費用」から見える教訓として、ツール選定の優先度がコスト構造によって異なる点が示唆される。
SAP’s acquisition spree signals the enterprise giant is serious about becoming an AI-ready data platform
Source: The Decoder | Published: 2026-05-05 21:46 JST
- SAPがオープンデータレイクハウス企業Dremioと、表形式基盤モデルを開発するAI企業Prior Labsの買収・出資に踏み切った。
- Prior Labsには4年間で10億ユーロを投入し、同社を「次世代AI研究所」へ進化させると位置付ける。
- DremioとSAP Business Data CloudはApache IcebergフォーマットでSAP・非SAPデータを統合し、CTO Philipp Herzigは「断片化データからAI対応インテリジェンスへの移行」を実現すると述べた。
- 過去にはデータ管理企業Reltioを買収し、前年にはDatabricksとの戦略提携も発表しており、今回の買収は連続するAI基盤強化策の一部。
- 表形式エンタープライズデータの有用性を高める基盤モデル研究に明確に踏み込んだのが今回の差分。
Anthropic co-founder maps out how recursive AI improvement could outpace the humans meant to supervise it
Source: The Decoder | Published: 2026-05-05 21:15 JST
- Anthropic共同創業者Jack Clarkが、AIが自らの後継モデルを訓練する「再帰的自己改善」が「ほぼ確実に迫っている」と主張した。
- 確率推定は2027年末までに約30%、2028年末までに約60%。
- 根拠としてSWE-Benchの2%(Claude 2)→93.9%、METRの30秒(GPT-3.5)→約12時間、CORE-Bench 95.5%、Anthropic内部テストの2025年5月2.9倍→2026年4月52倍を提示。
- リスクとして「アライメント手法が再帰的自己改善で崩壊する可能性」「99.9%精度の手法でも50世代後に約95%へ低下」「フェイク・アライメント」「不正が効率的解決として強化される訓練環境」を列挙。
- AI研究者Herbie Bradleyは「ジュニア研究は引き継げるが研究的センスと創造性は限定的」と反論を寄せた。
White House briefed Anthropic, Google, and OpenAI on plans for a government AI review process
Source: The Decoder | Published: 2026-05-05 18:53 JST
- ホワイトハウスが新AIモデル公開前に政府レビューを義務付ける大統領令を検討中で、5月初旬にAnthropic・Google・OpenAIの代表へ説明したと報じられた。
- 引き金はAnthropicの「Mythos」モデル。ソフトウェア脆弱性発見能力が極めて高く同社は「サイバーセキュリティの劇変」を理由に公開を控え、NSAは既に利用中。
- 英国モデルが「テンプレート」と評され、複数機関が安全基準を満たすか評価する仕組みが参照される予定。
- 政権は当初規制廃止路線だったが、AI由来のサイバー攻撃懸念、共和・民主両党で50%超がAIに懸念を示す世論、3月のAI推進派David Sacks退任を経て方針が転換した。
- レビュー手続きは技術経営者と政府関係者で構成される作業部会で策定される。
OpenAI・Anthropicがエンタープライズ向け合弁会社を相次いで発表、Sierraが9.5億ドル調達など:2026年5月5日AI動向まとめ
Source: Qiita | Published: 2026-05-05 21:22 JST
- OpenAIの新JV「The Development Company」は40億ドル調達、評価額約100億ドル規模、TPG・Brookfield・Advent・Bain Capital等19投資家が参加する。
- AnthropicのJVは15億ドル規模で、Blackstone・Hellman & Friedman・Goldman Sachsが中核、ApolloやSequoia Capitalらも参加するエンタープライズ向け展開会社。
- Sierraは9.5億ドルのシリーズEを調達(ポストマネー約158億ドル、Tiger Global/Google GVリード、Benchmark/Sequoia/Greenoaks参加)、ARRは1.5億ドル、PrudentialやCigna、Blue Cross Blue Shield、Rocket Mortgageなどが顧客。
- サウジアラビアPIF傘下のHUMAINが提供する「HUMAIN ONE」がAWS上で一般提供開始、AWSとの50億ドル超の共同投資計画(2025年5月発表)の延長線上に位置付く。
- 1日のうちにエンタープライズAI周りで複数のメガ調達・JV設立が並んだ点を1本にまとめたダイジェスト記事。
Datadog State of AI Engineering 2026完全解説 — 本番LLMの5%が失敗する原因と対策
Source: Qiita | Published: 2026-05-05 20:19 JST
- Datadogの2026レポートによれば、本番環境のLLMリクエストは約5%が失敗、その60%はレートリミットに起因。2026年3月時点でエラー率は2%まで改善したが、月間336万件のレートリミットエラーが残る。
- 組織の69%が3モデル以上を併用するマルチモデル運用に移行、OpenAIシェアは63%(12pt減)、Claudeは+23pt、Geminiは+20ptと増加した。
- エージェントフレームワーク採用率は9%→18%に倍増(LangChain/LangGraph/Pydantic AI/Vercel AI SDK)、一方で59%のエージェントが単一サービス呼び出しのみで「Agent Sprawl」化が進む。
- システムプロンプトが入力トークンの69%を占めるにも関わらずプロンプトキャッシュ採用は28%にとどまり、最大90%のコスト削減余地が放置されている。
- レポートの結論は「スケーリングではモデル選定よりオペレーション設計が重要」。
Claude Opus 4.7 への移行で 400 エラーを避ける
Source: Zenn | Published: 2026-05-05 20:25 JST
- Opus 4.6→4.7移行で発生する4つのBreaking Changeをまとめた実務ガイド。
- 旧構文
"thinking": {"type": "enabled", "budget_tokens": 10000}は400エラーになり、"thinking": {"type": "adaptive"}+ルート直下の"output_config": {"effort": "medium"}に置き換える必要がある。 - Bedrockは
temperaturetop_ptop_kを明示的に拒否するようになり、サンプリングはプロンプトエンジニアリング側で吸収する方針。 thinking.displayの既定値が"summarized"から"omitted"へ変更されたため、推論を画面表示するUIは明示的に"display": "summarized"を指定する必要がある。effortの値はlow/medium/high/xhigh/maxで、InvokeModel/Converse/bedrock-mantleSDKすべてでoutput_config配下に置く必要があると検証している。
AIエージェントのツール設計を本番品質に高める:スキーマ進化・障害モード・契約テストの実装戦略
Source: Zenn | Published: 2026-05-05 21:45 JST
- 著者は本番障害の88%が「モデル品質ではなくスキーマ・エラー処理・バージョニング」のインフラ層に起因すると指摘した。
- 障害モードを4種に分類し発生比率を提示: Context Blindness 31.6%, Rogue Actions 30.3%, Silent Degradation 24.9%, Memory Corruption 8.1%。
- 品質ベースのCircuit BreakerをHTTPエラーではなく「セマンティック不変条件の違反」で発火させ、
failure_threshold=3でトークン浪費を90%削減した事例を示す。 - マルチモデル対応ではCanonical Schemaを単一の真実源として、OpenAI/Claude/Gemini固有形式へはアダプタ層で変換する設計を推奨。
- 契約テストの欠落でリトライが暴走しコストが180ドルから3-5ドルに削減できた具体例を挙げ、エラーレスポンスに
retry_allowedフィールドを必須化する。
Gemini API Docs MCP入門 — Agent SkillsでCoding Agentの精度を96.3%に向上させる
Source: Zenn | Published: 2026-05-05 18:14 JST
- Gemini API Docs MCPは公式ドキュメントへのリアルタイムアクセスを提供するMCPサーバで、
search_documentationツール経由で訓練データの陳腐化を回避する。 - Agent SkillsはGoogle公式の4種(
gemini-api-dev/vertex-ai-api-dev/gemini-live-api-dev/gemini-interactions-api)で、最新SDKパターンとベストプラクティスをエージェントに注入する。 - 両者を併用するとvanilla promptingに対して正解率96.3%・トークン63%削減を達成したとされる(評価データセットの詳細は未公開)。
- セットアップは
npx add-mcp "https://gemini-api-docs-mcp.dev"とnpx skills add google-gemini/gemini-skills --skill gemini-api-dev --globalの2コマンドのみ。 - 対応エージェントはClaude Code・Cursor・Gemini CLI・GitHub Copilot、公式ブログでの公開は2026年4月1日。
Claude が要らない作業を安いモデルに移す。 217 件の実測で 17 倍のコスト削減
Source: Qiita | Published: 2026-05-05 19:52 JST
- 3週間・217件のタスク実測で、判断・統合をClaude、機械的作業をDeepSeek V4 Flash(コンテキスト窓1M)に分担すると約17倍のコスト削減を確認した(0.41ドル対約7ドル)。
- 移譲対象は「ファイル分類」「JSON/YAML整形」「ドキュメント要約」「文字列項目抽出」「一括文字置換」など機械的作業に絞っている。
- 実装は
arizen-dev/deepseek-mcpをMCPサーバとして接続し、応答時間は3-25秒で許容できると報告。 - CLAUDE.mdの指示形式が効果を左右し、否定形「Claudeをこれらに使うな」は確実に機能、肯定形「DeepSeekをこれらに使え」は約30%無視されたという発見。
- 単純な「全部安いモデル」ではなく、Claude側に判断責務を残しつつ作業を委譲するハイブリッド構成が要点。
AI エージェント向け OpenAPI 3.1 設計 — 日本住所正規化 API の実装事例
Source: Zenn | Published: 2026-05-05 16:00 JST
- Shirabe Address APIをChatGPT/Claudeから利用する過程で発生した3つの失敗を起点に、OpenAPI 3.1設計の落とし穴を整理した。
- GPT Builderの説明文300文字制限で詳細仕様がインポート失敗する、
normalizeとnormalizeBatchのような曖昧なoperationIdが系統的に誤呼び出しされる、attributionが欠落しLLM要約で出典情報が失われる、の3つを具体例で提示。 - 解決策はLangChain/Dify向けの完全版とGPTs向けの300文字以下の凝縮版を別建てで配信するデュアルスペック方式。
- レスポンスの
attributionフィールドを必須化することで、CC BY 4.0準拠の出典情報がLLM生成文中まで伝播するように設計した。 - 2026年4月にはJIS住所コード・自治体識別子をレスポンスに追加してGemini「ideal output」形式への適合を進め、実装はCloudflare Workers + Fly.io上のabr-geocoderエンジンを利用している。
[ローカルLLM性能評価レポート] Qwen3.6-35b-a3b
Source: Zenn | Published: 2026-05-05 20:12 JST
- AMD Ryzen AI MAX+ 395 / Radeon 8060Sの高性能機でQwen3.6-35b-a3bをフルスタックWebアプリ開発に投入し、Claude Opus 4.6から総合B評価を得た。
- 強みはドキュメント生成(全9セクション網羅)、S3統合などのアーキテクチャ設計、修正ほぼ不要なDocker構成、ローカル環境ドキュメントはA評価。
- 弱みはPHP構文エラー多発、Laravel 12のAPI実装が誤り、設計書間の技術仕様不整合、複雑なデバッグで無限ループに陥る傾向。
- コンテキスト累積で応答速度が劣化し、128K→32Kへの短縮で入力速度が約6倍改善、Qdrant+埋め込みのベクトルインデックス併用で問題解決能力が顕著に向上した。
- 結論として、ドキュメント・初期設計には有用だがコード精度はGemini 3 Flashなどクラウドモデルに及ばず、業務利用は別モデルを継続。
正確性評価がLLMのハルシネーションを招く:Nature掲載論文が暴くインセンティブ構造
Source: Zenn | Published: 2026-05-05 19:33 JST
- Nature掲載論文を起点に、ハルシネーションは「モデルのバグ」ではなく現在の訓練・評価構造から必然的に生じる結果だと整理した解説記事。
- IIV還元定理により「生成エラー率はIIV(是否判定)分類エラー率の2倍以上」になることが数学的に示され、判定誤りがある限りハルシネーションは消えない。
- 5つの誤差源として認識的不確実性35%・モデル仕様限界25%・計算的困難さ15%・分布シフト15%・訓練データ誤り10%を提示。
- 二元評価(正解/不正解)は「わからない」より推測の期待値を高めてしまうため、推測の方が報酬される構造になっている。
- 提案されるOpen-rubric評価は「高信頼度&正解+1点 / 高信頼度&不正解-3点 / 低信頼度棄権0点」で、不確実性の認識を最適戦略にする狙い。
All Articles
Zenn
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | Claude Code に全てのコードを書いてもらって、初めて Web アプリケーションをリリースできた話 | Claude CodeにLambda Goアプリ・Terraform AWS構成・Reactフロント・テストまで一切手書きせず初リリースした体験記。 | @kokei | 20:40 |
| 2 | 規制業界のデータレジデンシー要件下で AIエージェントの推論を日本国内に閉じる | Amazon Bedrock JP Geo Cross-Region InferenceでClaude推論を国内リージョンに閉じ込め、規制業界のデータ越境要件をクリアする構成検証。 | @nemf | 17:31 |
| 3 | Claude Managed Agents で消える層、残る層: 業務自動化エージェントの視点から | 2026年4月8日リリースのClaude Managed Agentsについて、業務自動化エージェント運用者目線で消える/残る役割を分析。 | @ikenyal | 16:29 |
| 4 | AIで「手を動かす時間」を減らす:技術者のための時間投資戦略 | AIツールへの「投資」と「消費」を区別し、ツール活用が実際に手を動かす時間の削減につながるかの判定軸を提示。 | @ふみ_BENTEN WebWorks | 15:57 |
| 5 | AIに記事を書かせる方法&めちゃくちゃ勉強になった話 | Claude CodeとGitHub連携で記事をローカル下書き・反復推敲してZennに公開する自前パイプラインの組み立て手順。 | @Takeshi | 20:15 |
| 6 | AIエージェントは Amazon で本を買えるか? — MoonAgents Card が解いた構造的問題 | エージェントが現実の決済を踏めない構造上の壁(本人認証・カード登録)をMoonAgents Cardが解く設計を分析。 | @Natsuki Yamaguchi | 19:14 |
| 7 | Visa vs Mastercard――AIエージェント決済の設計思想がこれほど違う理由 | カード国際2社のエージェント決済プロトコルの認証戦略の違いを比較し、自律購買向けの設計思想を読み解く。 | @Yuta | 18:45 |
| 8 | ChatGPT Pro $100プラン入門 — Codex 5倍枠と2層Pro体制の全容 | OpenAIの新$100/月プランがCodex使用枠を5倍にした2層Pro体制で、Claude料金との比較を含めた選び方を整理。 | @甲斐 甲 | 18:14 |
| 9 | Zenn Bookを出した最初の1週間――売上1部・PV169・大規模改訂1回の全記録 | Zenn Bookを公開して最初の1週間で売上1部・PV169・大規模改訂1回という生データを公開した運用日誌。 | @saitoko | 18:10 |
| 10 | AIエージェントのルールをハードコードしない:Policy / Effect Catalog の versioning 設計 | AIエージェントのポリシーをコードに直書きせずPolicy/Effect Catalogでバージョニング運用する設計の提案。 | @かなりあ | 17:21 |
| 11 | PHPで競馬AIを自作した〜楽天競馬パーサー編〜 | PHPで競馬予測AIを構築するシリーズの楽天競馬パーサー編、出馬表データ抽出時のパース課題と実装手順。 | @さく猫 | 16:30 |
| 12 | Nano Banana 2 が生んだ「カスタムブランド・アバター」で、技術発信を自律化する | Google WorkspaceのカスタムAIアバター生成(Nano Banana 2)を使い、組織のブランド維持型動画コンテンツ自動生成に挑戦。 | @サウナ大好きエンジニア | 15:34 |
| 13 | AIに「最適です」と言われた瞬間に検証が止まる: METRが映した3つの認知バイアス | METR研究を引用し、熟練エンジニアでもAI提案を受けた瞬間に検証を止めてしまう3種の認知バイアスを整理。 | @井本 賢 | 14:50 |
| 14 | AIに何かを任せるにはまず言語化の練習をしよう | 暗黙の文脈で意思疎通する人間と異なり、AIには明示指示が前提という違いから「言語化練習」を勧める論考。 | @Yuuki.Y | 13:16 |
| 15 | CLAUDE.mdを育てる技術|4プロジェクト運用で学んだメモリ設計 | 4プロジェクト同時運用で蓄積した、AIの再発ミスを抑えるCLAUDE.mdメモリ設計とフィードバックの型。 | @REON | 13:13 |
| 16 | agent に E2E テストを書かせる時、実装 diff を context として渡す設計を入れた話 | E2Eテスト生成エージェントに実装diffをcontextとして渡す設計を採用し、テスト範囲を変更点に絞り込んだ事例。 | @zoetaka38 | 13:03 |
| 17 | 生成AI時代のOSSはバズったもん勝ち? | 生成AI時代のOSS持続可能性について、発見性・バズの優位性が成功要因になりつつある現状への問題提起。 | @黒ヰ樹 | 12:58 |
| 18 | Claude Code の loop スキルでポーリング監視 | Claude Codeに組み込まれたloopスキルを使い、ポーリングや反復監視タスクを間隔指定で自動化する技術ガイド。 | @becky | 12:30 |
| 19 | 自宅鯖のハード選びと引っ越しをClaudeに丸投げしたら1日で終わった話 | 自宅サーバのハード選定・移行作業をClaudeに丸投げしたところ、検討から実作業まで1日で完了した移設記録。 | @QuoLu | 12:02 |
| 20 | 高校生がサイゼリヤをCLIから注文できるようにした件 ─ 技術・法律・倫理を多角的に考える | 高校生によるサイゼリヤ非公式CLI注文クライアント実装と、技術成果に対する法的・倫理的論点の多角整理。 | @yunamun | 11:58 |
| 21 | Ollama実践入門──ローカルLLMをMacBook上で動かしてRAG・MCPと組み合わせる【2026】 | OllamaでMacBook上にローカルLLMを立ち上げ、LangChain・RAG・MCPまで連携させる2026年版ハンズオン。 | @karaagedesu | 22:36 |
| 22 | LLMアプリにOAuthでモデル利用権限を委譲するのは現実的なのか | BYOC・OAuthでLLM利用権限をユーザに委譲するアプローチを、Claude Codeアーキテクチャと比べて現実性を検討。 | @さき(H.Saki) | 22:05 |
| 23 | ハーネスエンジニアリング入門【概要 & 実践的TIPS】 | AIエージェントの繰り返しエラーやセッション状態管理の課題を「ハーネスエンジニアリング」として体系化する入門。 | @ますみ / 生成AIエンジニア | 21:59 |
| 24 | AIに任せたはずなのに人間がコピペ中継している——A2A AgentCardで解消した | エージェント間のやり取りを人間が手作業で中継してしまう問題に対し、A2A AgentCardで自律連携にした実装記録。 | @いち | 19:22 |
| 25 | Codex appを使ってみた。CLIより「作業の見通し」が良くてけっこう好きだった | Codex appをCLIと比較し、タスク整理・進捗可視化の点で「作業の見通し」が改善するという使用感レポート。 | @どぅくし | 19:20 |
| 26 | AI Agent Platform(Google Cloud Gemini Enterprise Agent Platform編) | Google CloudのGemini Enterprise Agent Platformを実行環境・ツール統合の視点で機能分解する解説。 | @KojiTsukamoto | 19:00 |
| 27 | ChatGPT Proは学生に必要か?卒研・修論・個人開発目線で契約してみた | 卒研・修論・個人開発の各局面でChatGPT Proが妥当な投資かを学生視点で実契約して評価した検証記事。 | @あまり | 21:52 |
| 28 | .env.keysを端末から消したかったので、dotenvxに1Password CLIを組み合わせてみた | 端末上に.env.keysを残さない運用を狙い、dotenvxと1Password CLIを連携させた単一障害点回避の手順。 | @cti1650 | 17:17 |
| 29 | コンテキストエンジニアリングを徹底的に追求する | プロンプト単体ではなくLLM指示無視・RAG精度低下といった「システム全体最適化」をコンテキスト工学として深堀。 | @株式会社ノーコードソリューションズ | 13:52 |
| 30 | サクッと始める生成AI用語集【RAG、AIエージェント、Fine-tuning、AI駆動開発】 | 初心者向けに生成AIの主要用語を約4時間で押さえる体系的用語集Book、概念マップ付き。 | @ますみ / 生成AIエンジニア | 13:23 |
| 31 | Apple Healthの10年分1.8GBをSQLite化して、自然言語で身体データに問いかけられるようにした | Apple Healthの10年・1.8GBのデータをSQLite化し、ClaudeにMCPで繋いで自然言語で身体データを問い合わせる自作環境。 | @玉井秀明 | 23:31 |
Qiita
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | ハードウェアバディでClaudeとおともだち | Claude DesktopのハードウェアバディIoT機能で、M5 StickC Plusなど物理デバイスとClaudeを接続する手順。 | @moritalous | 23:19 |
| 2 | 【Claude × Discord】MCPでDiscordボットを自然言語で操作する方法【Claude Desktop】 | 日本語情報が少ないClaude Desktop×Discord×MCPの連携を、自然言語でDiscordボットを操作する形で構成した実装手順。 | @Yuffter | 22:18 |
| 3 | 大量のSkillを効率的に管理する特化型CLIツール「sklock」を作りました | 多数のAI Agent Skillを効率管理する特化CLI「sklock」の自作レポート、設計目的と機能の紹介。 | @artie | 22:15 |
| 4 | Claudeに毎朝のSlack棚卸しを任せたら、1日43分浮いた話 | Claude Coworkで毎朝のSlack受信整理を自動化し、計測ベースで1日43分の作業時間を削減した運用事例。 | @Ngen | 21:04 |
| 5 | 2026年〜2027年のAI界隈の様子を予想 ChatGPTとGPT-Image2にて | ChatGPTとGPT-Image2を使い、2026〜2027年のAI業界動向を画像生成事例とともに予想する記事。 | @hotstaff | 23:01 |
| 6 | AIエージェントとは何か?ChatGPTとの本質的な違いを整理する | AIエージェントとChatGPTの違いを「性能差ではなくアーキテクチャ差」として整理した入門解説。 | @bao880906 | 21:56 |
| 7 | 画像から動画へ:ChatGPT Image 2とSeedance 2を活用した実際のワークフロー | ChatGPT Image 2とSeedance 2を組み合わせ、小規模チームで画像→動画生成する実ワークフローを示す手順。 | @kollabjp | 12:04 |
| 8 | ローカルLLM Qwen3.6 27B Qwen3.6-27B-UD-Q4_K_XL.ggufの調べ物とGPT-5.3の調べ物結果の比較 | ローカルQwen3.6 27B量子化版とGPT-5.3を論文調査タスクで比較し、AIエージェント上での実用差を測定。 | @ishigaki | 21:40 |
| 9 | プロンプトインジェクション検出モデルを育てる — 失敗を分析して v2 に改善するまで | PromptGateライブラリのプロンプトインジェクション検出モデルをv1の失敗分析からv2に改善するまでの工程記録。 | @kanekoyuichi | 19:12 |
| 10 | GASとGeminiを活用した筋トレメニューの自動生成と管理方法 | Google Apps ScriptとGeminiでトレーニングメニューを自動生成し、メールリマインダーまで連携する個人運用システム。 | @ruih8gta | 22:20 |
| 11 | 【実験】Gemini で画像生成してマッチングアプリのプロフ写真を作ってみた話──数字で見えてきた”限界”と”正解” | Geminiで生成したマッチングアプリ用プロフ写真の効果を数値で検証し、「限界」と「正解」を抽出した実験記事。 | @kenji-ai-match | 19:18 |
| 12 | [Google Cloud Next ‘26 体験記 #4] 2 つの Keynote 現地レポート | Las Vegas開催Google Cloud Next ‘26の現地レポート第4弾で、2つのKeynoteに焦点を当てた現場記録。 | @koichim33 | 13:31 |
| 13 | MAAR の 3 ルールが SPOF を撃ち抜いた話 — TTL=3 / Checksum / Karpathy が止めた 5 つの暴走 | Multi-AIアーキテクチャで業務影響シミュレータをv3.1→v7.3まで急速反復し、TTL=3/Checksum/Karpathyの3ルールでSPOFを潰した記録。 | @JUMP_IN | 10:08 |
| 14 | 【備忘録】Codex appのAutomationsを試す前に整理したこと | Codex appのAutomations機能の挙動とローカルファイル連携の前提を、試す前に整理した個人備忘録。 | @Tadataka_Takahashi | 16:56 |
| 15 | Claude Codeで生活アシスタントが住むPCを作った話 | Claude Codeで「マスター、それ二度寝のフラグですよ」と話す日常予定・天気を伝える常駐アシスタントPCを構築。 | @iganaki | 22:08 |
| 16 | ローカル LLM で AI コーディング支援環境を構築する④ (ベンチマーク結果) | Bonsai-8Bでローカル開発支援環境を構築するシリーズ第4回、自前ベンチマーク結果から見える傾向の整理。 | @koutaro_harada | 17:16 |
| 17 | 記事要約:McKinsey - エージェント時代に向けたエンタープライズ・アーキテクチャの再考 | McKinsey記事の日本語要約で、判断短期化が進む企業環境向けにAI統合の段階的導入アプローチを論じる。 | @tayamash | 12:53 |
| 18 | AI agent と Agent Skills ってそもそも何だろう | AI chat / AI agent / Prompt / Agent Skillsという混同しがちな用語を、それぞれ何が違うかから整理する入門。 | @igapyon | 12:50 |
| 19 | LLMesh: Local LLMをMCPで安全につなぐP2P Swarm PoCを作った | 複数のローカルLLMをMCP経由で安全に相互接続するP2P SwarmアーキテクチャのPoC「LLMesh」自作プロジェクト。 | @furuse-kazufumi | 18:59 |
ITmedia AI+
(Top 20で全件採用済み)
GIGAZINE
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | 無料で「ComfyUI」「Open WebUI」などからローカルAIモデルをGPUで動かすDocker環境を一発で構築し動かし続ける「Puget Systems Docker App Packs」 | Puget SystemsがComfyUI/Open WebUIなどのローカルAI実行環境をDockerで一発構築するOSS、Ubuntu 24.04/Win11 WSL2、CUDA 12.6+対応。 | - | 18:00 |
OpenAI Blog
(Top 20で全件採用済み)
Simon Willison
(Top 20で全件採用済み)
The Decoder
(Top 20で全件採用済み)