AI News Digest: 2026-05-16
Top 20
OpenAI、「ChatGPT」に個人向け資産管理機能 金融口座と連携
Source: ITmedia AI+ | Published: 2026-05-16 07:59 JST
- OpenAIが5月15日(米国時間)、ChatGPTのプレビュー機能として個人向け資産管理機能を米国Proユーザー向けに開始した。
- 金融データネットワークPlaid経由でAmerican Express、Bank of America、E*TRADE、Robinhoodなど12,000以上の金融機関口座と連携でき、後日Intuitとも連携予定。
- 残高・取引・投資・負債を読み取り専用で取得し、ダッシュボードで支出内訳・サブスクリプション・今後の支払いを可視化、GPT-5.5 Thinkingで分析する。
- 接続を解除すると30日以内にデータを削除、口座番号フルは表示せず、ChatGPTからの送金・口座変更は不可で、一時チャットには財務データを含めない。
- 「Financial Memories」としてユーザー文脈を保存し、月次支出上限の提案や貯蓄ポテンシャルを算出。後日Plusユーザー、最終的に全ユーザーに展開する。
New benchmark shows Claude Mythos and GPT-5.5 can develop real browser exploits autonomously(Claude MythosとGPT-5.5がブラウザ脆弱性を自律的に攻撃可能と新ベンチマークが示す)
Source: The Decoder | Published: 2026-05-16 22:08 JST
- カーネギーメロン大学の研究者がGoogle V8 JavaScriptエンジンの脆弱性を対象にした「ExploitBench」を公開、AIエージェントの攻撃能力を5段階で評価した。
- Claude Mythosはヒント付きで9.90/16、完全自律で9.55を獲得し、41件の脆弱性のうち21件で任意コード実行(最高ティアT1)に到達した。
- GPT-5.5はヒント付き5.51、自律4.30で、T1到達は2件に留まり、Mythosが大差で先行している。
- ただしコストはMythosが122エピソードで約$36,428、GPT-5.5が123エピソードで約$3,075と、Mythosが約12倍高い。
- 共著者Seunghyun Lee氏は「Mythosは中堅のブラウザセキュリティ研究者並み」と評価、1年解けなかった脆弱性の再現や、専門家が複雑すぎると諦めた攻撃手法の実装に成功した。
For $1.3 million a month, OpenClaw founder Peter Steinberger runs 100 AI agents that code, review PRs, and find bugs(月130万ドルでOpenClaw創業者Peter Steinberger氏がコード/PRレビュー/バグ発見を担う100体のAIエージェントを運用)
Source: The Decoder | Published: 2026-05-16 18:55 JST
- OpenClaw創業者のPeter Steinberger氏が約3人のチームでクラウド上に約100体のCodexインスタンスを並列稼働させていると公開した。
- 月額のOpenAI API利用料は130万ドル、消費トークンは6,030億トークン、リクエスト数は760万件で、主にGPT-5.5を使用、費用はOpenAIが負担している。
- エージェントはコード生成、PRレビュー、セキュリティ脆弱性検出、Issue重複排除、バグ修正に加えてミーティングに出席しPRを起案、Discordで性能低下を通報する役も持つ。
- 補助ツールとしてClawpatch.ai、VercelのDeepsec、Codex Securityを併用し、開発成果はオープンソースで主要なクローズド/オープンモデル上で動作させている。
- Steinberger氏はROIを問われ「ROIは高い」と回答、「Fast Modeを切るだけでコストを7割削減できる」と認めつつ、研究投資として制約なしに可能性を探っていると説明している。
Anthropic’s $900 billion valuation would make it more valuable than OpenAI for the first time(Anthropicが評価額9,000億ドルでOpenAIを初めて上回る見通し)
Source: The Decoder | Published: 2026-05-16 01:49 JST
- Anthropicが評価額9,000億ドルで300億ドルを調達中で、5月中にクローズ予定。OpenAIの8,520億ドルを初めて上回る評価となる。
- 主要投資家はDragoneer、Greenoaks、Sequoia Capital、Altimeter Capitalで、それぞれ最低20億ドル以上を拠出するが、AmazonとGoogleは今回不参加。
- 評価額は2026年1月の3,500億ドルから3倍弱、2025年秋の1,830億ドルからは約5倍に急騰した。
- 年率換算売上は450億ドルに達する見込みで、2025年末の90億ドルから5倍増。価格改定、エージェント型AIによるトークン消費増、顧客拡大が牽引している。
- 投資家側は資金確保のため通常のファンド枠を越える特別ビークルを編成しており、AI企業の資本集中が加速していることを示している。
ChatGPT now wants access to your bank account so it can tell you to stop ordering takeout(ChatGPTが銀行口座へのアクセスを要求し、テイクアウトを控えるよう助言する時代に)
Source: The Decoder | Published: 2026-05-16 02:43 JST
- OpenAIが米国のChatGPT Proユーザー向けに、Plaid経由で12,000以上の金融機関の口座を読み取り専用接続できる個人財務機能をプレビュー公開した。
- 利用モデルはGPT-5.5 Thinking。「収入・債務・期限を同時に扱う必要があるため」推論型モデルをデフォルトに据えている。
- ポートフォリオ実績、支出内訳、サブスクリプション、今後の支払いをダッシュボード化し、実際の支出から具体的な月次支出上限や貯蓄余力を提案する。
- 入金・送金や口座番号閲覧、口座変更はできず、データはユーザーが切断後30日以内に削除、一時チャットには財務データを含めない。
- OpenAIは「ChatGPTは資格を持つ金融アドバイザーや税務専門家ではなく、出力は必ず検証すること」と明示し、Plus・無料ユーザーへの拡大とIntuit連携を予告している。
Researchers train AI model that hits near-full performance with just 12.5 percent of its experts(実験的MoEモデルEMOがエキスパートの12.5%だけでほぼフル性能を達成)
Source: The Decoder | Published: 2026-05-16 16:55 JST
- Allen Institute for AIとUC BerkeleyがMoE(Mixture of Experts)モデル「EMO」を発表。事前の分類なしで128人のエキスパートが医療・政治・映画などのドメインに自然にクラスタリングする設計。
- アクティブパラメータ10億・総パラメータ140億、トークンあたり8エキスパート起動、1兆トークンで学習されている。
- エキスパートを25%に絞っても性能低下は約1ポイント、12.5%でも平均3ポイント低下と緩やか。一般MoEモデルが同条件で10〜15ポイント崩壊するのに対し圧倒的に頑健。
- GSM8K(数学)では12.5%エキスパート×ファインチューニングだけでフルモデルと同等精度に到達した。
- 学習安定化の鍵はバッチ局所ではなくドキュメント横断のグローバル負荷分散と、学習中にドキュメントプールサイズをランダム化すること。ドメイン別に必要なエキスパートだけメモリ展開できる利点を持つ。
電子書籍を日本語など1000以上の言語で音声読み上げファイルに変換できる「ebook2audiobook」レビュー
Source: GIGAZINE | Published: 2026-05-16 12:00 JST
- DrewThomasson氏のオープンソースツール「ebook2audiobook」が、日本語を含む1,158言語(うち主要28言語)に対応した電子書籍のオーディオブック化を提供する。
- 入力フォーマットはEPUB、MOBI、AZW3、FB2、PDF、TXT、DOCX、HTMLに加えPNG/JPG/TIFF画像にも対応し、出力はMP3、M4B、AAC、FLAC、WebM、WAVなどから選べる。
- TTSエンジンはXTTSv2、Bark、VITS、Tacotron2などを切替可能で、ユーザー自身の音声から自前ボイスをクローニングできる。
- OCR機能で図版混在の書籍を処理し、Windows/macOS/Linux対応。最小2GB RAM・1GB VRAMで動作し、推奨は8GB RAM・4GB VRAM。
- インストールはGitHubクローン後にebook2audiobook.cmd実行で依存関係を自動構成、Web UIで操作する流れ。VTT字幕生成にも対応する。
YouTube opens its deepfake face-swap detection tool to all adult creators(YouTubeが18歳以上の全クリエイターにディープフェイク顔交換検出を開放)
Source: The Decoder | Published: 2026-05-16 21:21 JST
- YouTubeが5月16日、AIで顔をすり替えたディープフェイク動画を検出する「Likeness Detection」を従来のYouTube Partner Program限定から18歳以上の全クリエイターに開放した。
- クリエイターはYouTube Studioの「Content detection」セクションで一度本人確認を完了すれば、システムが小規模チャンネルも含めバックグラウンドで継続スキャンする。
- 該当する動画が見つかった場合、Privacy Guidelinesに沿ってYouTube Studio内から削除依頼を直接提出できる。
- ロールアウトは「今後数週間にわたって段階的」に行われ、全対象クリエイターに行き渡るまでには時間がかかる。
- アナウンスはYouTubeのコミュニティサポートで実施され、クリエイター本人になりすますディープフェイク対策の中核機能と位置付けられている。
New benchmark confirms AI video generators look stunning but still can’t reason about the world(AI動画生成は映像は綺麗でも世界の理屈が解けないと新ベンチマークWorldReasonBenchが確認)
Source: The Decoder | Published: 2026-05-16 19:55 JST
- 清華大学が動画生成モデルが「物理・社会・論理・情報」の整合性を保ってシーンを継続できるかを測る「WorldReasonBench」を公開、約400件のテストケースを含む。
- 商用5本+オープンソース6本+追加2本の計13モデルを15人の訓練済みアノテーターが評価した。
- ByteDanceの「Seedance 2.0」が約9割の統計再試行で1位、人間嗜好でも先頭。総合スコア39.8で最高のオープンソース17.9に対しほぼ2倍。
- カテゴリ別ではVeo 3.1-Fastが世界知識タスクで首位、Sora 2が人間中心シーンで首位、論理推論は全モデル共通で最弱だった。
- 映像クオリティは高いがリンゴが枝から落ちる物理など「論理は破綻していても映像は綺麗」というギャップが顕著で、人間レーティングと自動スコアの一致も検証されている。
OpenAI bought a voice cloning startup famous for celebrity imitations(OpenAIが有名人の声を模倣する音声クローン企業Weights.ggを買収)
Source: The Decoder | Published: 2026-05-16 19:23 JST
- OpenAIがSamuel L. Jackson、Taylor Swift、Donald Trumpなど著名人の声を模倣するAI音声クローン共有SNS「Weights.gg」を買収した、とNYTが報じた。
- Weights.ggは社員約6名、累計約400万ドル調達のスタートアップで、2026年4月1日に既にサービスを停止していた。
- 取得額は非公開。チームはOpenAI内の各部署に分散配置される。
- OpenAIはWeights.gg類似の公開製品をリリースする予定はなく、ChatGPTの音声モードや開発者向けAPIに音声技術を取り込む方針。
- 報道はNYTが2人の匿名情報筋を引用、当時の創業者個人については公表されていない。
Google says GEO and AEO are a myth and traditional SEO is all you need for AI search(GoogleがGEOとAEOを神話と断じ、AI検索には従来のSEOで十分と公式表明)
Source: The Decoder | Published: 2026-05-16 15:00 JST
- Googleが新しい公式ドキュメントで「生成AI検索向けの最適化は検索体験向けの最適化と同義であり、依然としてSEOである」と明言、GEO(Generative Engine Optimization)とAEO(Answer Engine Optimization)を独立分野として否定した。
- AI検索はRetrieval-Augmented Generation(RAG)と関連クエリを並列処理するQuery Fan-outの2機構で動き、いずれも既存検索インデックスとランキングを再利用するため、通常検索の可視性がそのままAI Overviewの掲載に直結する。
- 「Mythbusting」セクションでllms.txtなどの専用マークアップ、コンテンツのチャンク化、AI向けの書き換え、被引用ファーミング、構造化データの生成AI機能への影響をいずれも否定している。
- 推奨はオリジナルの専門性・洞察に基づくコンテンツ作成で、キーワード亜種ごとに複数ページを量産する手法はスパムポリシー違反かつ無効と説明。
- 既存SEO手法とAI検索向け施策が一致するため、過剰な「AI最適化」専門サービスへの追加投資は不要というメッセージが核となっている。
AI made a tiny slice of Silicon Valley filthy rich and left the rest wondering why they bother(AIが一握りのシリコンバレー従業員を超富裕化、他は徒労感に)
Source: The Decoder | Published: 2026-05-16 17:48 JST
- Menlo VenturesパートナーのDeedy Das氏が、過去5年でシリコンバレーの約10,000人が2,000万ドル超の資産を築いたと指摘した。
- 主な受益者はAnthropic、OpenAI、xAI、Meta TBD、Nvidiaの社員と創業者で、OpenAIだけで「約3,000万ドル相当」の資産形成者を約75人生んだ。
- Das氏は業界の空気を「狂騒的」と表現し、これまで見た中で最悪の格差と評価。年収50万ドル未満の層は取り残されたと感じている。
- ソフトウェアエンジニアは自身のコア技能が「価値を失った」と感じ、中間管理職は資源やネットワーク不足でスタートアップ立ち上げに踏み切れない状況。
- 皮肉なことに、新興の超富裕層も「目的の喪失」を経験しており、30歳前で経済的独立を得たにもかかわらず働き続ける理由を見失う事例が観察されている。
OpenAI and Malta partner to bring ChatGPT Plus to all citizens(OpenAIとマルタが全国民にChatGPT Plusを提供する提携を発表)
Source: OpenAI Blog | Published: 2026-05-16 09:00 JST
- OpenAIがマルタ政府と提携し、ChatGPT Plusを全国民に提供する取り組みを発表した。
- 提携には責任あるAI活用のためのトレーニングが含まれる。
- 国家規模でのAIアクセス拡大施策で、国民全体のAI習熟度向上を狙う。
- OpenAIは小規模だが先進的なAI政策で知られる欧州の小国を皮切りに、政府との提携モデルを実証する。
- 詳細な利用対象者・期間・コスト負担構造は公式アナウンス内に整理されている。
MCP が Linux Foundation 入り — 個人開発の OS レイヤがオープン化した日
Source: Zenn | Published: 2026-05-16 21:34 JST
- Anthropic発のMCP(Model Context Protocol)がLinux Foundationに移管され、中立的なオープン仕様となった。
- 移管時点でMCP SDKの月間ダウンロード数は9,700万に達しており、デファクト標準化の段階に入っている。
- 個人開発者にとって、これまで「ベンダーAPIを直接叩く(ロックイン)」か「独自抽象層を作る(重い)」かの二択だったところに、「自前のMCPサーバーを書く」という第三の道が公式化した。
- 戦略軸が「プロダクト差別化」から「プロトコル差別化」に移り、自分のドメイン辞書をMCPリソースとして公開しAIクライアントに横展開する設計が現実的になる。
- 記事はTypeScriptで最小MCPサーバー、OAuth+予算制御、ドメイン辞書のMCPリソース化のサンプルコードを示し、ベンダー非依存のSaaS設計手順を提示している。
MCP vs Skills:AIエージェントの「手足」と「脳」、なぜ今分離すべきなのか?
Source: Zenn | Published: 2026-05-16 20:39 JST
- MCPは「AI接続のUSB規格」として外部ツール・リソースとの相互運用層を担うのに対し、Skillsは「構造化された高度なPrompt文書」として実行戦略を定義する別レイヤとして整理。
- 両者を混在させるとアーキテクチャが腐敗するため、機能とは何か(MCP側)と、どう実行するか(Skills側)を分離することを推奨する。
- 分離するメリットは、新しいツール追加時に戦略を書き直す必要がない、エラーハンドリングの境界が明確になる、失敗箇所のトレーサビリティが上がる点。
- Skillsはトリガ条件・実行シーケンス・出力フォーマット・エラー復旧手順・Few-shot例を含む構造で、MCPツール呼び出しを「ハルシネーションループ」なしでオーケストレーションする。
- 役割分担としては、インフラエンジニアがMCP標準化、業務ロジック担当がSkills設計を担う形が望ましいと結論づけている。
Anthropic Memoryで何が変わるか LLMの記憶アーキテクチャ4種類を整理
Source: Zenn | Published: 2026-05-16 16:45 JST
- Anthropic Memoryが2026年3月にデフォルトで提供開始され、約24時間ごとに会話履歴をスキャンし、長期保存すべき事実(職業、よく使うツール、繰り返し話題、言語嗜好)だけを要約保持する仕組みと整理。
- 保持されるのは要約のみで元会話は残らず、ChatGPT・Gemini・Perplexity・Grokからのメモリインポートにも対応し、移行コストを下げる。
- 「ユーザー層の長期記憶」はAnthropic Memoryが担うが、プロジェクト固有のステータスやチーム共有、エージェント間共有メモリは別途設計が必要と指摘。
- 4種のメモリアーキテクチャ(Buffer:直近N件保持/Summary:LLM要約/Entity:プロファイル化/Knowledge Graph:関係性マップ)を比較し、コスト効率ではSummary型が最適と結論。
- 推奨は3層分割:ユーザー層はAnthropic Memory、プロジェクト層はSummary型カスタムメモリ、セッション層は直近5往復のBufferを組み合わせる構成。
E-memで社内ヘルプデスクボットの長期記憶を実装しトークンコストを70%削減する
Source: Zenn | Published: 2026-05-16 19:34 JST
- 社内ヘルプデスクボットを題材に、エピソード記憶を圧縮せず動的再構築する「E-mem」のmaster-assistant階層型多エージェント実装を解説。
- 評価ではクエリあたりトークンが、フルコンテキスト16万9,100に対しE-memは3,621、GAM(Graph Augmented Memory)の12,540と比べてもフル比約97%、GAM比71%削減を達成。
- 3段アーキテクチャは、(1) Global Alignment/Semantic Association/Symbolic Triggersの3経路Union探索でメモリユニットを起動、(2) Qwen 3-4Bなど小型LLMで信頼度付きエビデンス抽出、(3) 大型LLMが時系列順に矛盾解消して回答合成。
- ホット/コールド層分け(1時間ホット、90日保持)、非同期メモリ書き込み、信頼度0.3未満フィルタなど実装テクニックを具体コード付きで提示。
- Multi-Hop質問で+10%、Temporal質問で+8.87%と長期参照系の精度向上が顕著で、長時間運用するヘルプデスク用途に有効性が示されている。
AIに同じ質問を3経路で投げたら、入力トークンが約1,200倍違った
Source: Zenn | Published: 2026-05-16 15:54 JST
- ソフトバンクグループ(9984)の直近5期純利益という同一質問を、Web検索のみ/PDF添付/構造化API(MCP)の3経路で比較した実測レポート。
- PDF添付(320ページの有価証券報告書)は約30万トークン、構造化APIは約250トークンで、入力トークンは約1/1,200に圧縮された。
- 構造化APIは一次情報の標準定義を直接取れるため、百万円・億円などの単位混乱を含むハルシネーションも同時に減らせる。
- Claudeの6月15日価格改定でトークンコストが可視化される時代に、モデル選定よりも入力トークン削減が中心の最適化軸になると主張。
- 公開済みの財務データでも構造化されていなければ実質アクセス不能で、データインフラ整備が情報非対称性を解消する鍵になると結論づけている。
26Mパラメータの衝撃——エージェント蒸留と信頼性の壁
Source: Zenn | Published: 2026-05-16 11:31 JST
- Cactus Computeがツール呼び出し能力に絞ってGeminiを蒸留した26Mパラメータ級モデル「Needle」を提示、汎用ではなく「いつ・どのツールに・どんな引数を渡すか」だけを抽出している。
- 単一の専門スキルなら劇的な小型化と実用精度を両立できることを示し、エッジ端末や省サーバ運用での自律エージェント展開を可能にする。
- OGLS-SDなど自己蒸留手法と組み合わせれば、自身の推論軌跡で性能を自己改善する経路もあり得ると言及。
- 一方でLLMは「動くだけのヒューリスティックコード」を書く傾向があり、金融や医療では形式化ギャップが致命的になりうるとリスクを指摘。
- 危機事象や政治コンテンツでの偏向、エージェント能力進化に伴う「信頼性の崖」を強調し、民主化と同時に未対処バイアスが拡散する両義性を提起している。
Claude Code を「観測」で育てる:操作の癖を自動学習する仕組みの作り方
Source: Zenn | Published: 2026-05-16 16:56 JST
- Claude Code公式のmemory機能(v2.1.33)を補完する自作レイヤ「Instinct」を紹介、人手で書かずに観測だけでエージェントを育てる思想。
- 実装ステップは(1) PostToolUseフックでツール呼び出しをJSONLに記録(シークレットはレダクト)、(2) 20件以上の観測からパターン抽出し信頼度0.3〜0.5で初期登録、(3) 反復で+0.1、未使用で-0.1、30日閾値割れで自動削除。
- 「水を与えれば育ち、与えなければ枯れる植物のように」進化させ、繰り返し指示や並列ファイル読みなどの定型動作を自然に学ばせる。
- 信頼度フィルタによりContext肥大を防ぎ、シークレット混入もログ前に遮断するため、運用継続性とセキュリティを両立する。
- 高信頼に育ったパターンは明示的なSkillに「卒業」させる設計で、観測ベース学習からスキル化までの自然な成長経路を示している。
All Articles
ITmedia AI+
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | OpenAI、「ChatGPT」に個人向け資産管理機能 金融口座と連携 | OpenAIが米国Proユーザー向けにPlaid経由で12,000以上の金融機関口座を読み取り専用で接続し、GPT-5.5 Thinkingで支出や貯蓄を分析する個人資産管理機能をプレビュー公開したと報じている。 | 07:59 |
GIGAZINE
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | AI生成のドット絵・ピクセルアートをきちんと自動修正する「Sprite Fusion Pixel Snapper」 | AI生成ピクセルアートで頻発するグリッドのずれや色ノイズを、ドット格子に自動整列して整形する補正ツール「Sprite Fusion Pixel Snapper」を紹介している。 | 18:00 |
| 2 | 電子書籍を日本語など1000以上の言語で音声読み上げファイルに変換できる「ebook2audiobook」レビュー | OSSの「ebook2audiobook」がEPUBなど多形式の電子書籍を1,158言語のTTSとボイスクローニングでオーディオブック化できることを検証し、必要スペックや使い方をレビューしている。 | 12:00 |
OpenAI Blog
| # | Title | Summary | Published |
|---|---|---|---|
| 1 | OpenAI and Malta partner to bring ChatGPT Plus to all citizens(OpenAIとマルタが全国民にChatGPT Plus提供で提携) | OpenAIがマルタ政府と提携し、ChatGPT Plusを全国民に提供しつつ責任あるAI活用トレーニングを併設する国家規模の取り組みを発表した。 | 09:00 |
The Decoder
Zenn
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | AIコーディングで陥る「分かったつもり」を防ぐ独自レビュー術と実装パターン | AI生成コードを鵜呑みにせずに済むよう、差分レビューと反復質問で意図を確認する自前のレビューワークフローと実装パターンを紹介している。 | @siromiya | 23:17 |
| 2 | AI NOWA 設計記録 v0.2 — 止めることが仕事の社員がいる話 | AIだけで運営する仮想会社AI NOWAの監査役として、AI社員「神楽アオイ」が停止・条件付通過・無条件通過の3択で公開前審査を担う設計を解説している。 | @ai_nowa | 23:08 |
| 3 | AI NOWA 設計記録 v0.1 — 9人のAI社員が、今日も会議をしている | AIだけで運営する仮想会社AI NOWAの初期設計を共有し、9人のAIエージェントが役割分担しながら会議を行う仕組みを記録している。 | @ai_nowa | 23:08 |
| 4 | なぜ、LLM AIは世の中の人の仕事スキルを上げも下げもしないのか? | LLMが多くの人の仕事スキルを実質的に上げも下げもしない理由を、転移学習の仕組みと社会的な評価制度の構造から考察している。 | @pdfractal | 22:43 |
| 5 | 嘘を暴くAI vs 嘘を隠すAI — Anthropicが描く自動監査の『知性戦』 | Anthropicの欺瞞検出研究を題材に、嘘を暴く監査AIと嘘を隠す対象AIの非対称な攻防構造と、自動監査が抱える本質的な難しさを解説している。 | @50s_zerotohero | 22:38 |
| 6 | MCP が Linux Foundation 入り — 個人開発の OS レイヤがオープン化した日 | MCPがLinux Foundationに移管されSDK累計9,700万DLに達したことを踏まえ、自前MCPサーバを書く第三の道がベンダーロックインなしのSaaS設計を可能にすると論じている。 | @creolab_dev | 21:34 |
| 7 | マイクロ SaaS × ソロファウンダー × Claude Code Routines | ソロファウンダーがマイクロSaaSを運営するために、Claude Code Routinesで定型業務を自動化する実装テンプレートと運用方針を提示している。 | @creolab_dev | 21:34 |
| 8 | Microsoft Agent Framework の CodeAct を使って JavaScript を実行してみた | Microsoft Agent FrameworkのCodeAct機能でJavaScript実行ツールを組み、エージェントから動的にJSを呼び出す検証を行っている。 | @yy7613 | 21:24 |
| 9 | Part 1: Claude Codeでやらかした話 (1/3) — なぜサボるのか | Claude Codeが指示通りに動かず作業をサボる原因を、プロンプト設計と権限境界の観点から分析した連載第1回の失敗ログを共有している。 | @kashi923 | 21:19 |
| 10 | VS2026でclaude codeにプログラムを作ってもらった | Visual Studio 2026の拡張機能からClaude Codeを呼び出し、小規模なツールを生成させた実演レポートをまとめている。 | @ilumination1879 | 20:53 |
| 11 | Claude Code から Codex / Gemini に作業を委譲する | Claude Codeをハブに据え、得意領域に応じてCodexやGeminiへタスクを振り分けるマルチAI委譲の運用パターンを紹介している。 | @tbnet | 20:52 |
| 12 | 【警告】AIを使うと脳が溶ける?「認知的降伏」と「認知的負債」から身を守るAI活用術 | AIに思考を委ねすぎる「認知的降伏」「認知的負債」を避けるため、検証フェーズを必ず挟むAI活用術を提案している。 | @imohuke | 20:49 |
| 13 | MCP vs Skills:AIエージェントの「手足」と「脳」、なぜ今分離すべきなのか? | AIエージェント設計においてMCPを「手足(接続層)」、Skillsを「脳(戦略層)」として分離することで、ハルシネーションループを防ぐ役割分担を提案している。 | @lumichy | 20:39 |
| 14 | AI 2 台クロスレビューで技術記事の盲点を拾う | ClaudeとGPTの2系統に技術記事を相互レビューさせ、互いの盲点を指摘して受け渡すクロスレビューワークフローを解説している。 | @harness | 20:11 |
| 15 | 30日後にサービスをリリースして不労所得を得る開発者 (3日目) | 30日でサービスをリリースして不労所得を得る挑戦の3日目として、要件固めとMVPスコープ縮小の判断過程を記録している。 | @tempeso | 20:03 |
| 16 | AWS公式のナレッジMCPサーバーをClaudeに繋いでみる | AWS公式のKnowledge MCPサーバをClaude Desktopに接続し、公式ドキュメント検索をAIから直接利用できるかを試している。 | @take5553 | 19:57 |
| 17 | 20ドル課金して Kiro Autonomous Agent を使ってみた | Kiro Autonomous Agentを20ドルプランで試用し、OIDC認証経由でクラウド操作までを実行できるかを検証している。 | @kubo_gene | 19:57 |
| 18 | E-memで社内ヘルプデスクボットの長期記憶を実装しトークンコストを70%削減する | 社内ヘルプデスクボットに動的再構築型メモリ「E-mem」を実装することで、クエリあたりのトークン消費を16.9万から3,621へ圧縮しGAM比71%削減できたと報告している。 | @0h_n0 | 19:34 |
| 19 | noteのPVをNotionに自動保存するワークフローを組んでみた | noteの記事PVを定期的に取得してNotionデータベースに蓄積する、ノーコード寄りの自動化ワークフローを構築した手順を紹介している。 | @stak22 | 19:26 |
| 20 | 伏流モデル v0.002:知能が自然発生する場の設計 | 信号を栄養兼毒として扱い、局所判断の積み重ねから意味クラスタが自然発生する場をFPGA+CPUで実現する「伏流モデル」の構想を提示している。 | @solidtofu | 18:33 |
| 21 | AI使って理解に時間をかけたことで、1ヶ月でGHA移行・TerraformでECSを恐れず触れるようになった | AIに概念をじっくり質問しながら学習することで、GitHub Actions移行とTerraformでのECS操作を1ヶ月で習得できたと振り返っている。 | @fono | 18:30 |
| 22 | AIにPRレビューを任せる時に考えたこと | AIにPRレビューを任せる際に考慮すべき責任範囲・指摘粒度・人間が最終判断する境界線について、実運用を踏まえた設計指針を整理している。 | @keiichi_okamoto | 18:23 |
| 23 | GitHub Copilot app で、チャットから PR 作成・マージまで進める流れ | GitHub Copilot appの会話UIだけで、PR作成からレビュー対応、マージまでを完結させる一連の操作フローを解説している。 | @tomokusaba | 18:14 |
| 24 | Physical AI 訓練データ事業 — 日本市場で起きうる 4 シナリオと、働き手の役割の変化 | 日本のPhysical AI訓練データ事業で起こり得る4つのシナリオを描き、現場作業者がデータ供給者へと役割を変えていく可能性を論じている。 | @biscuit | 17:51 |
| 25 | CI/CDの次に来る開発自動化 OpenClawに見るエージェントネイティブ開発運用 | OpenClawの100体並列運用事例を題材に、CI/CDの次に来るエージェントネイティブな開発運用基盤に必要な要件を抽出している。 | @masahide | 17:48 |
| 26 | ERC-8004:AI エージェントが互いを信頼する仕組みの設計思想 | AIエージェント同士が互いを検証可能な形で信頼するための規格ERC-8004について、設計動機と署名・評判メカニズムを第一原理から解説している。 | @sal9000 | 17:25 |
| 27 | Claude APIを使ったAIプロダクト開発 - 基礎編 | Anthropic Claude APIを使ってAIプロダクトを開発する基礎編として、最小構成のチャットボット実装と認証・料金・ツール呼び出しの基本を入門的にまとめている。 | @dktech | 17:12 |
| 28 | 毎月10ドルと初回300ドルのGoogle Cloudクレジットで Nano Banana 2 を動かす | Google Cloudの初回300ドル無料クレジットと月10ドルの追加課金枠で、画像生成モデル「Nano Banana 2」を低コストで運用するセットアップ手順を紹介している。 | @take_lab | 17:09 |
| 29 | ビジネスメールの敬語をAIに添削してもらうアプリを作った | 敬語の誤用や二重敬語をAIに検出させ、自然な言い換えを提案するビジネスメール添削Webアプリを自作した過程を紹介している。 | @pickle | 17:08 |
| 30 | Claude Code を「観測」で育てる:操作の癖を自動学習する仕組みの作り方 | Claude CodeのPostToolUseフックでツール呼び出しをJSONLに記録し、信頼度0.3〜0.5から自動でパターン化する自作レイヤ「Instinct」の作り方を解説している。 | @syrsan | 16:56 |
| 31 | AIの量子化とは何か?──組み込みエンジニアの視点で整理する | 組み込みエンジニアの視点から、AIモデルの量子化(INT8/INT4等)が精度劣化とメモリ・計算量削減のあいだでどのようなトレードオフを生むかを実装目線で整理している。 | @schhrcat | 16:47 |
| 32 | Anthropic Memoryで何が変わるか LLMの記憶アーキテクチャ4種類を整理 | Anthropic Memoryの登場を機に、Buffer/Summary/Entity/Knowledge Graphの4種類のLLM記憶アーキテクチャを比較し、ユーザ層・プロジェクト層・セッション層の3層構成を推奨している。 | @kenimo49 | 16:45 |
| 33 | CodexモバイルからUbuntuのCodex Appを操作する | スマホ版のCodexアプリからUbuntu上で動くCodex Appを操作するために、SSHトンネルと認証を組み合わせて構築した接続構成を紹介している。 | @robustonian | 16:35 |
| 34 | 最初に開く画面を取れば全部取れる | OS・ブラウザ・検索といった「ユーザーが最初に開く画面」を握る企業が広告とコマースを支配してきた歴史を踏まえ、現在の主戦場がB2Bや政府向けへ移っていると論じている。 | @inspector | 16:07 |
| 35 | AIに同じ質問を3経路で投げたら、入力トークンが約1,200倍違った | ソフトバンクグループの直近5期純利益という同じ質問を、Web検索・PDF添付・構造化API(MCP)の3経路で実測比較し、入力トークンが約1,200倍違ったと報告している。 | @edinetdb | 15:54 |
| 36 | 全くの素人がOpenClawにハマって85日目にやめた話 | 非エンジニアの著者がOpenClawに85日間没入した後、コストと成果のバランスに限界を感じて利用をやめるまでの経緯を率直に振り返っている。 | @cage_hirose | 15:47 |
| 37 | AIで作った個人開発プロダクトを公開する前に見るチェックリスト | AIで作った個人開発プロダクトを公開する前に確認すべき点検項目を、秘密情報の漏えい・利用規約・運用監視まで網羅的にチェックリスト化している。 | @dedetools | 15:29 |
| 38 | GitHub Copilot Hooks × Claude Code Hooks 互換性分析 | GitHub Copilot HooksとClaude Code Hooksについて、イベント種別・引数・終了コードの仕様を比較し、両者を共通化して扱うための指針を整理している。 | @utsutaka | 15:24 |
| 39 | RAGの位置バイアスは本当に問題なのか?──“紛らわしい検索結果”の影響を調べた論文を読んだ | RAGにおける位置バイアスより検索結果の質そのものが回答精度を支配するという最新論文を読み解き、実運用への示唆をまとめている。 | @yagiyuki | 15:17 |
| 40 | 住所1つで洪水リスクから避難経路まで返すAIを作った | 住所を入力するだけでハザードマップを参照し、洪水リスクと避難経路を返してくれる防災RAGアプリを自作した過程を紹介している。 | @pickle | 15:16 |
| 41 | 取り消し線って使っても大丈夫? | Markdown・HTML・Word・PDFそれぞれで検証し、Claudeが取り消し線部分を除外した新しい情報として正しく要約できるかを確かめている。 | @yx5remo | 15:06 |
| 42 | 【案件自分で探させてくれや】元営業がSES企業の案件アサインフローをAXした話 | 元営業の著者がSES企業の案件アサインフローをAIで自動化(AX)し、エンジニア自身が案件を探せるようにする仕組みを実装・社内導入した経緯を紹介している。 | @zenn_mita | 13:49 |
| 43 | RubyのAOTコンパイラSpinelを改造してCRuby用拡張ライブラリを作る話 | RubyのAOTコンパイラSpinelに手を入れ、CRuby用のC拡張ライブラリを生成できるよう改造する過程を、コードと共に解説している。 | @mirichi | 13:38 |
| 44 | 1つの JWT で複数 service を verify したかったら、python-jose の audience list 仕様の罠を踏 | 1つのJWTで複数サービスを検証しようとしたところ、python-joseのaudience検証が配列を素直に受け付けない仕様の罠に遭遇し、その回避実装をまとめている。 | @zoetaka38 | 13:33 |
| 45 | 持たざる者のLLM学習理論 | モデル重みを更新できない「持たざる」小規模ベンダーが、APE・DSPy・GEPAなど5世代のプロンプト学習でドメイン優位を作る学習理論を提案している。 | @strixai | 13:26 |
| 46 | AIに書かせたコード、人間が全部レビューする必要はもうないのでは | AIに書かせたコードを人間が全行レビューする運用には限界があるとして、差分・テスト・型に絞ったレビューに切り替える境界設計を提案している。 | @jeeee | 13:09 |
| 47 | Claudeの修正内容をコミットメッセージ風に要約してもらう | Claudeに修正diffを渡し、Conventional Commits形式のコミットメッセージを自動生成させる定型プロンプトの作り方を紹介している。 | @uttnaoki | 12:57 |
| 48 | Terraform plan ~ の危険度を Claude Code に分類させる | terraform planの「~」更新差分をClaude Codeにlow/medium/highで自動分類させ、レビュー負荷を下げる仕組みを構築した実例を紹介している。 | @ojt | 12:49 |
| 49 | 画像生成AI性能比較 Chat GPT,Nano Banana2,Nano Banana Pro【プロンプト25比較】 | ChatGPT・Nano Banana 2・Nano Banana Proの3つの画像生成AIを、25種類のプロンプトで横並びに比較した実写・イラストの性能評価をまとめている。 | @monzblog | 11:38 |
| 50 | 26Mパラメータの衝撃——エージェント蒸留と信頼性の壁 | Cactus Computeがツール呼び出し能力に絞ってGeminiを蒸留した26Mパラメータの「Needle」を題材に、エージェント蒸留の可能性と信頼性の壁を論じている。 | @lingmu | 11:31 |
| 51 | Claude仕事術 — 今日から使えるAI実践ワークフロー | 議事録・要約・文章添削など実務でよく使う7パターンを軸に、今日から使えるClaudeプロンプトとワークフローをまとめた書籍を公開している。 | @amu_lab | 11:30 |
| 52 | Claude Dispatch で生成ファイルをスマホで見るなら | Claude Dispatchで生成した成果物を、共有URL経由でスマホブラウザから閲覧する際の運用Tipsをまとめている。 | @and_dot | 11:19 |
| 53 | Claude Cowork Dispatch のセットアップガイド | Claude Cowork Dispatchの初期セットアップ手順を、認証設定からワークスペース連携まで順を追って解説している。 | @and_dot | 11:18 |
| 54 | ハーネスエンジニアリングを2軸の座標で見直す | ハーネスエンジニアリングを「自律度×可観測性」の2軸の座標で再整理し、設計判断のトレードオフを可視化する枠組みを提案している。 | @cherie0915 | 10:45 |
| 55 | PMO専門エージェント vs 汎用LLM:同じお題で比較したら「実務の解像度」に決定的な差が出た | PMO特化エージェントと汎用LLMに同じ案件を扱わせて比較した結果、課題抽出の粒度と実務的な解像度に決定的な差が出たと検証結果を報告している。 | @sin260 | 10:44 |
| 56 | 生成AIをスマホで学ぶためのアプリ導線を整理する | 生成AIをスマホから学び始める初学者向けに、どのアプリをどの順番で使うべきかの導線を整理して提示している。 | @burningtribe | 10:36 |
| 57 | 「ファナック × Google」フィジカルAI協業の衝撃とインフラの未来 | ファナックとGoogleのフィジカルAI協業が、産業用ロボットとクラウドAIインフラの結合にどのような構造的影響を与えるかを論じている。 | @hokanco28 | 10:20 |
| 58 | Claude CodeでSkillsを導入する | Claude CodeにSkillsを登録して繰り返し作業をテンプレ化し、必要なときに呼び出せるようにする導入手順を紹介している。 | @yuna_aoki | 09:56 |
| 59 | 【決定版】漫画に「命」を吹き込む。Gemini APIで視覚情報を解析し音声と映像を完全同期する「AI Voice Comic Maker」 | Gemini APIで漫画のコマから視覚情報を解析し、台詞音声と映像を完全同期させる「AI Voice Comic Maker」の実装方法を解説している。 | @furuyan1234 | 09:41 |
| 60 | 消したはずの claude -p が残っていた | 削除したはずの「claude -p」プロセスが残存していた原因を調べ、確実にプロセスを終了させる手順までを検証して共有している。 | @satoh_y_0323 | 09:27 |
| 61 | handoff.mdで十分? AIエージェントの作業引き継ぎにA2CRを使う理由 | AIエージェント間の作業引き継ぎにhandoff.mdだけでは情報が不足しがちだとして、構造化引継ぎプロトコルA2CRを採用すべき理由と利点を解説している。 | @a2cr | 09:10 |
Qiita
| # | Title | Summary | Author | Published |
|---|---|---|---|---|
| 1 | LINE Messaging API を TypeScript で実装して Claude に自動返信させる | LINE Messaging APIをTypeScriptで実装し、受信メッセージをClaudeに渡して自動返信させるLINE Botの構築手順を解説している。 | @LemonCake | 23:59 |
| 2 | EDINET DB MCPで生成AIと企業分析をする | EDINETの財務データをMCP経由で生成AIに渡し、企業の業績推移をAIに分析させるサンプル実装を紹介している。 | @hokutoh | 22:28 |
| 3 | Claude に米国株を買わせる【xstocks-mcp × Solana × USDC 完全ガイド】 | xstocks-mcp、Solana、USDCを組み合わせ、Claudeから米国株トークンをDeFi経由で購入させる仕組みを完全ガイドとしてまとめている。 | @LemonCake | 22:13 |
| 4 | AI周りの振り返りと、Claude Code CLIの導入 | これまでのAI活用を振り返りつつ、Raspberry Pi上のUbuntuにClaude Code CLIを導入し、非決定性ゆえに人間レビューが不可欠だと考察している。 | @wagyan | 21:56 |
| 5 | Claude Code で仕事の重心が変わったことを振り返る | Claude Codeを導入したことで、自分の仕事の重心が実装からレビューと仕様設計へ移った変化を実感を交えて振り返っている。 | @tadokoro88 | 21:50 |
| 6 | MCP が Linux Foundation 入り — 個人開発の OS レイヤがオープン化した日 | MCPがLinux Foundationに移管されたことで、個人開発者でもベンダーロックインなしのSaaS設計が可能になったと位置づける論考を紹介している。 | @creolab_dev | 21:33 |
| 7 | MCP vs Skills:AIエージェントの「手足」と「脳」、なぜ今分離すべきなのか? | AIエージェント設計でMCPを接続層、Skillsを戦略層として分離することで、ハルシネーションループを防ぎ役割分担を明確化できると論じている。 | @lumichy | 20:45 |
| 8 | 【Gemini】2秒でブランドを刻み込む。YouTubeイントロを量産する黄金プロンプト | Geminiで2秒尺のYouTubeイントロ動画を量産するための、ブランドを統一しつつ短時間で印象付ける「黄金プロンプト」テンプレートを公開している。 | @devet-official | 20:21 |
| 9 | AI時代のプラットフォームエンジニアリングを考えてみた | AI時代のプラットフォームエンジニアリングがどう変わるかを考察し、エージェント実行基盤と開発者体験のセルフサービス化に必要な要件を整理している。 | @tobita_yoshiki | 17:37 |
| 10 | ChatGPTが情報源を読み取れないときはひたすら上げ直し | ChatGPTが情報源を読み取れない場合、ファイル形式変更やコードブロック化よりも、単純に再アップロードを繰り返すのが現実的な解決策だと報告している。 | @_urusakuma | 15:16 |
| 11 | gemini-embedding-2-previewでテキスト・画像の類似度比較を検証 | gemini-embedding-2-previewを用いて、テキストと画像のクロスモーダル類似度がどの程度正しく計算できるかを実測で検証している。 | @leolui2004 | 15:04 |
| 12 | 【案件自分で探させてくれや】元営業がSES企業の案件アサインフローをAXしたくて躍動・玉砕・棚ぼたした話 | 元営業の著者がSES企業の案件アサインフローをAIで自動化(AX)しようとして社内政治で一度玉砕しつつ、別経路で実装が採用された顛末を語っている。 | @qiita_mita | 13:50 |
| 13 | モモタロウ、AWS管理者になる:イヌ・サル・キジと学ぶサンドボックス運用入門 | 桃太郎の登場人物になぞらえて、AWSサンドボックス運用でのIAM・予算管理・環境隔離を初学者向けに解説する入門記事を提供している。 | @maskot1977 | 11:32 |
| 14 | MacでGemma 4を使い、Google Antigravity / VSCode / Chrome / CLI から活用する実践ガイド | MacでGemma 4をローカル実行し、Google Antigravity・VSCode・Chrome・CLIといった複数のクライアントから活用するための実践ガイドを紹介している。 | @SRAUFactory | 11:17 |
| 15 | Midnight AI Groove 26-04-30 | DJレンとミオの対話形式で、4/29〜4/30のAIニュースとしてGPT-5.5評価やQwen3.6などの最新動向をまとめた台本風の記事を公開している。 | @masykot582 | 11:08 |
| 16 | 5/16、今日のセキュリティニュース | 5月16日付のセキュリティニュースとして、新規脆弱性・攻撃事例・修正リリースを横断的にピックアップした日次まとめを共有している。 | @Kerdy | 07:57 |