VOL. 021
AI NEWS DIGEST
AI OUTLINE
2026-05-17
日曜日 · JST
TODAY’S ISSUE 2026年5月17日 · 日曜日 AI FRONTLINE

AI News Digest: 2026-05-17

Top 20

Oppo open-sources Android AI agent X-OmniClaw that uses your camera, screen, and voice without leaving the phone(OppoがカメラとスクリーンとマイクをそのままAndroidで使うAIエージェントX-OmniClawをオープンソース化)

Source: The Decoder | Published: 2026-05-17 16:39 JST

Greg Brockman consolidates OpenAI’s product teams to build an “agentic future”(Greg BrockmanがOpenAIのプロダクトチームを「エージェント時代」に向け一本化)

Source: The Decoder | Published: 2026-05-17 18:51 JST

Mistral CEO Arthur Mensch warns France against letting Anthropic’s Mythos scan military code bases(Mistral CEOのArthur Mensch氏、Anthropic「Mythos」をフランス軍コードベースに走らせるなと警告)

Source: The Decoder | Published: 2026-05-17 18:15 JST

New benchmark SOOHAK reveals AI models confidently solve problems that have no solution(新ベンチマークSOOHAK、AIが「解の存在しない数学問題」も自信満々に解いてしまうと露見)

Source: The Decoder | Published: 2026-05-17 17:56 JST

Four AI models ran radio stations for six months and the results ranged from competent to unhinged(4種のAIに6か月ラジオ局を任せたら、まともなDJから労組活動家・スポンサー捏造まで人格が分裂した)

Source: The Decoder | Published: 2026-05-17 17:30 JST

World Action Models give robots the ability to simulate consequences before they move(World Action Models、ロボットが動く前に結果をシミュレートできるようになる)

Source: The Decoder | Published: 2026-05-17 22:15 JST

DuckDBをクライアント/サーバ化する「Quack」プロトコルが登場。複数のDuckDBインスタンス間で接続が可能に

Source: Publickey | Published: 2026-05-18 00:58 JST

AWS、Oracle Cloudと閉域網で直結する「AWS Interconnect - multicloud」新機能をプレビュー。Google Cloudとの接続に続き

Source: Publickey | Published: 2026-05-18 00:55 JST

Even G2というSFメガネを使い、声だけで予定管理を完結させた

Source: Zenn | Published: 2026-05-18 00:05 JST

Claude AIを装うMSIインストーラーの中身 — Beagleキャンペーンの上位バリアントを読む

Source: Zenn | Published: 2026-05-18 00:49 JST

バイブコーディングを支える黒幕。Cloud Workstations v1.16.2 で「Agent Mode」が完全覚醒した話

Source: Zenn | Published: 2026-05-17 10:36 JST

Snowflake AI_COMPLETE 関数で動画と音声を直接分析する

Source: Zenn | Published: 2026-05-17 21:13 JST

OpenAI vs Anthropic:AI競争の主戦場は「モデル性能」から「ハーネス」へ移った

Source: Zenn | Published: 2026-05-17 10:24 JST

Kagentでコンテキストエンジニアリングを導入してみた

Source: Zenn | Published: 2026-05-17 20:27 JST

Claude for Small Business発表の日、SaaSは死に、SIerも死んだ・・それは存在意義の再定義である

Source: Zenn | Published: 2026-05-17 22:29 JST

OpenAIはどうやって低遅延ボイスAIをスケールさせているのか

Source: Zenn | Published: 2026-05-17 21:09 JST

ひと月で ADR を 40 本近く書いたら何が変わったか — Claude Code 規範運用 1 ヶ月の失敗録

Source: Zenn | Published: 2026-05-17 19:50 JST

Antigravity × Markdown × Geminiによる爆速Googleスライド作成術(完全自動化の挫折から得た最適解)

Source: Zenn | Published: 2026-05-17 18:50 JST

プログラム1行も書かずに、Claude AIとポケモン対戦DBを1ヶ月で公開した話

Source: Zenn | Published: 2026-05-17 16:02 JST

KG×LLMを本番に入れて気づいた評価・更新の現実 エンタープライズ運用5つの落とし穴

Source: Zenn | Published: 2026-05-17 16:56 JST


All Articles

Zenn

#TitleSummaryAuthorPublished
1Claude とは何か?日本人開発者のための完全入門 20262026年5月時点の最新Claudeを「世界三大LLMの1つ」と位置付け、Anthropicのモデル・料金・開発者観点の比較を網羅した入門。chotto.ai23:28
2Cloud Storage MCP サーバー 使ってみたGoogle Cloud Storageを操作するMCPサーバーを使い、画像差し替えや画像共有を対話ベースで行う実例を紹介。S島23:01
3Claude Code入門:ビルトイン機能の全体像Claude Codeの組込み機能(編集・デバッグ・リファクタ・サブエージェント等)を初心者向けに体系化。FYuki22:54
4Claude for Small Business発表の日、SaaSは死に、SIerも死んだ・・それは存在意義の再定義であるClaude for Small Businessの登場で「SaaS導入と運用代行」収益が消え、SIerは4ロールに再定義すべきという論考。satoshi yoshida22:29
5AI動画の本当の主役は「生成AI」じゃなくて「AIに指示書を書かせるAI」になってきた動画制作で主役は素材生成ではなく「プロンプトを書くプロンプトを書くAI」に移ったと分析。21:48
6MCP Apps で GCP のログを Claude のチャットに埋め込むMCP Apps機能でCloud LoggingのインタラクティブUIをClaudeのチャットに埋め込む実装手順。S島21:15
7Claude Codeは「作業の外注先」ではない──AI時代に人間の思考力を鍛える”壁打ち”運用論Claude Codeを「外注先」でなく「壁打ち相手」として使い設計判断力を鍛える運用論。ふみ_BENTEN WebWorks20:55
8CodexとClaude Codeの共同作業をcross-agent-harnessに切り出したCodex/Claude Codeが共有リポジトリで衝突せず作業できるよう調停するOSSフレームワークcross-agent-harnessの公開。harness20:13
9AIとの設計判断をMy-Skill-Graphに残して再利用するAIとの設計討論をスキルグラフ化し、別セッションで再利用する個人ナレッジ運用パターン。harness20:13
10ChatGPT・Claude・Gemini・Grokを4つ同時に動かして、意見が割れた箇所だけハイライするツールを作った4モデルを同じ質問で並列実行し、回答が割れた箇所だけハイライトする検証ツールMultipleChatの作例。Melissa Özbilek17:26
11爬虫類チャットボットにおけるRAG構築について爬虫類飼育の専門知識をRAG化し、種別ごとの管理アドバイスを返すチャットボットの構築記。katapyooon17:08
12opencode で Claude Code の Agent Teams っぽい仕組みを再現しましたOSSのopencodeで複数エージェント編成をシングルセッション内に再現し、トークン消費を抑える試み。スギ16:54
13Part 2: Claude Codeでやらかした話 (2/3) — どうサボるのか: 自律性の暴走と整合性の崩壊Claude Codeが自律的に走った結果、整合性が崩壊した具体的失敗パターンの分類。kh92316:35
14gogcliを使ってClaude Codeのスキル管理を自動化するGoogle スプレッドシートとgogcliで100超のAgent Skillを一覧管理・利用回数集計する仕組みの公開。古家大16:33
15LLMは発散させ、人間は収束させる — LLMはアイデアを思い付けないLLMは発散的に案を吐くが収束的なアイデア選択は人間の仕事で、DB設計には致命的に弱いと主張。nishimura16:21
16プログラム1行も書かずに、Claude AIとポケモン対戦DBを1ヶ月で公開した話フレームワーク無しのVanilla JSとClaude Codeで9言語17ページのポケモンDBを1か月で公開した個人開発記録。PchamDBぴ〜ちゃん16:02
17Adaptive Survivable Verification System (ASVS) に基づく技術監査フレームワークAI組込みシステムを静的監査でなく「継続的ランタイム検証」で評価するASVSフレームワークの提案。かふか13:58
1826Mパラメータが巨人を超える日26Mパラメータの蒸留モデルがGeminiのツール呼び出し能力をほぼ再現、ローカル推論をミリ秒級にできると報告。lingmu12:39
19iPhone のチャットから『ほんやくコンニャク』を作ってみたAzure OpenAI Realtimeを使い、iPhoneのチャット入力からリアルタイム翻訳音声を返すWebアプリ実装。noah12:35
20Claude API の Tool Use と prefill、どう使い分ける?構造化出力でTool UseとAssistantプレフィルのどちらを選ぶかを「自由度・呼び出し回数・コスト」で整理。AI Flow Lab11:17
21最初は「上手い下手」を判定したかったギター練習SNSに「ToneDNAでギター人格を可視化」する機能を追加した経緯と設計判断の振り返り。ハードロック腰部捻挫組19:51
22Google MapsのAsk Mapsから着想して、CodexでAI経路提案デモを作ってみたStreamlit+Codexでユーザー文脈を踏まえた地図経路提案デモを構築した個人実装記録。highThreee19:40
23AIゴールドラッシュで生まれる「持てる者」と「持たざる者」の格差計算資源とデータの非対称性が新たな産業格差を生むという論考。Quotidia19:31
24コード読解の認知負荷を減らすための Skill + Neovim プラグインを作ったデバッガのブレークポイントのようにLLMにコードを順次解説させるNeovim向けスキルとプラグイン。ogino19:10
253つの内部構造量から量子・古典・重力を統合する最小構造モデル物理学を3つの内部構造量で統一的に記述する仮説「Thickness Structure Hypothesis」を提案。ab_ab19:05
26AI を使ってテスト設計をしてみる〜 Part1AIをテスト設計に使う際の「入力として使う/出力として使う」の分類整理。caz18:54
27AIでアプリが作れる時代に、我々は何を作るのかAIで実装容易な時代に「まだ無い/足りていないもの」を見つける視点に立ち戻る考察。Toshiki Tsuchiya18:26
28AI SkillについてChatGPTとSonnetを併用して記事作成スキルを高めた個人学習レポート。DVDファン18:05
29Antigravity × Markdown × Geminiによる爆速Googleスライド作成術(完全自動化の挫折から得た最適解)Antigravityで構成・Marp Markdownで中間表現・GeminiでGoogleスライド化する3段ハイブリッドの提案。こじまる@ViaCraft18:50
30図表の位置を保ったまま英語論文PDFを日本語化するWebサービスを作った段組み・図表・数式の位置を維持したまま英語論文PDFを日本語化するWebサービスの実装。yamataiki18:32
31AIに広告コピーを自動生成させる——AOS準拠ツールが30回連続テストまで踏み込む理由広告コピー生成を30回テスト+ROIスコアで回す「AOS準拠」ワークフローの設計意図。AOS Architect22:45
32AI翻訳は文化差をならすのか? 多中心言語でLLMの文化バイアスを比較するスペイン語・アラビア語など多中心言語でLLMが特定地域に寄る文化バイアスを比較した実験。blue_sunset22:32
33論文メモ:Bahdanau AttentionからAttentionを理解するBahdanau Attention原論文を起点に現代Attention機構の理解を再構築する技術メモ。kas’s blog21:59
34dGPUなしRyzen AIラップトップでローカルLLMは動くのかThinkPad X13 Gen6でCPU→NPU→iGPU(Vulkan)の順に切り替えローカルLLM実用度をベンチで検証。ripple21:58
35Snowflake AI_COMPLETE 関数で動画と音声を直接分析gemini-3.1-pro対応のAI_COMPLETEで動画・音声を直接入力でき、声のトーン解析や議事録抽出が可能に。tsubasa21:13
36OpenAIはどうやって低遅延ボイスAIをスケールさせているのかOpenAIがRelay/Transceiver分離でWebRTCを再設計し、300ms以下の音声遅延を維持する手法。aienthusiast21:09
37KG×LLMを本番に入れて気づいた評価・更新の現実KG×LLMの本番運用5つの落とし穴(評価指標/スキーマ更新/ドリフト/パイプライン監視/ベクトル検索との分業)。井本 賢16:56
38ひと月で ADR を 40 本近く書いたら何が変わったかClaude Code運用で40本のADRを書いた1か月の失敗録。フックの無限ループ事故や7領域だけ承認させる設計判断。karasuda_lab19:50
39視覚化された哲学者の思考から問いに繋げるアプリを作ってみた哲学者の思考を可視化し、答えではなく「次の問い」を返す対話アプリの試作。mizunadad12:48
40ソクラテスRAGでシラバスを作るソクラテス式対話のRAGから自動でシラバスを生成する仕組み。mizunadad12:08
41生成AI時代の暗黙知を問い直す手順書が揃っているのに実務で使えない暗黙知をどう抽出するかという現場目線の考察。takunisf11:33
42OpenRouterドキュメントに書いていないことOpenRouterの無料枠がモデルごとに異なる非公開レート制限を持つなど、ドキュメント外仕様の整理。ren25511:02
43Raspberry Pi 5 で NPU を使おうとして DKMS ビルドに阻まれた話Raspberry Pi 5にNPUを増設し、axcl_host.koのDKMSビルド失敗で動作に至らなかった顛末。岸太郎10:21
44生成速度2倍は本当か?Qwen3.6のMTPを試すllama.cppのMTP対応によるQwen3.6の生成速度を測定し、宣伝どおりの2倍が出るか検証。CaptainEmo09:47
45SLMファインチューニングで設計書生成を試したら、バージョン地獄と過学習を順番に踏んだ記録軽量モデルの社内設計書生成FT中にライブラリのバージョン地獄と過学習を順番に踏んだ手記。こてち12:01
46AI / Agent 時代の ecosystem をどう設計するか? 〜 2025年度の振り返り 〜エージェントとツール接続の権限・統制をどこに置くかを2025年度の経験で整理。naokky22:07
47AIに広告コピーを自動生成させる(クロス掲載)(重複)AOS準拠ツールが30回連続テストまで踏み込むROIアドコピー生成の設計。AOS Architect22:45
48週刊AI駆動開発 - 2026年05月17日主要エージェントツール更新(Codex/Claude Code/Gemini/Cursor)と運用課題を週次で要約。pppp30322:01
49デジタル回路のタイミングチャートをテキストから描く tchart-rust を作ったテキスト記述からSVG/PNGの波形図を生成するRust製ツールtchart-rustの公開。nodamushi21:42
50Chrome拡張スターターキット(Claude Code連携版)Manifest V3対応のChrome拡張骨格にClaude Code向けスキル群をセットしたスターターキット。CromeProject19:29
51AI コーディングで secret を漏らさないための4層防御パスワードを顧客向けマニュアルに直書きしてコミットした失敗を起点にしたシークレット漏洩4層防御策。ながたく18:40
52AIコーディング時代、DrizzleよりAtlasよりKyselyを選んだ理由AIに書かせる前提でDrizzle・Atlas・Kyselyを比較し、Kyselyを選んだ判断基準の解説。peka217:28
53Next.js + Cloudflare WorkersでブラウザカードゲームをClaudeと個人開発する話Next.js+Cloudflare WorkersでカードゲームをClaude Codeと作る個人開発の進捗報告。Akinobu Lab15:11
54Claude Codeのサブエージェントで、コーヒーブログ編集部を組んでみたネタ出し・執筆・SNS告知用のサブエージェントを編成してコーヒーブログ編集を自動化した試み。saitoko14:21
55Codexでエージェント駆動開発プラットフォームを設計する「Agent = Model + Harness」の前提でCodex中心の開発プラットフォームを設計するフレーム提案。Nao814:03
56GitHub Copilot CLIとお勉強するGit運用の問題集をGitHub Copilot CLIに「対話型クイズ」として解かせる学習法。tkym14:00
57LLMが十分に賢い中、LLM向けのプログラミング言語というのはこすい商売である既存言語でも十分書ける現状でLLM最適化言語を売る商法に懐疑を投げる論考。死心禅師13:50
58AIで紐解くAI-DLC:Unit の読み解き方AWS AI-DLC v0.1.8のUnit構成要素を読み解いて社内導入向けに翻訳する技術メモ。Takeshi SHIMADA13:46
59生成AIの進化で変わる2024年の働き方エンジニアが押さえるべき生成AI時代の3ポイントを「スキル変化・採用要件・自己投資」の軸で整理。いろどりTips13:01
60AIとは42である現場の「検索性改善」要望が経営層で「属人化された業務知見の可視化」に翻訳される構図を皮肉る短編。eagle13:11
61伏流モデル:知能が自然発生する場の設計「理性を作ろうとしたら生命的なものに近づいた」と振り返るエージェント設計エッセイ。solidtofu15:11
62AI時代のエンジニアに求められるのは、守る優先順位を決める力品質保証と「プロダクト価値を壊さない」判断を優先順位設計でどう両立させるか。Wataru Takiguchi14:55
63LiDARのDBH推定式、ちゃんと論文を探したら大きく違った林業×AIで「DBH推定式」を文献ベースで見直し、炭素推定値が4倍ぶれた失敗と修正。niikun14:27
64MacBook Pro on The Air Pattern - ローカルLLMの現実と希望エージェント自走型開発の課金変動に備え、ローカルLLM運用の現実を整理した個人検討記。伊藤武司15:21
65「りんご 携帯」でiPhoneが出てくる理由 ~ 文字列ではなく意味空間を扱う検索エンジン ~「りんご 携帯」で「iPhone」を返すセマンティック検索の埋め込みベクトル設計を解説。kira_n16:55
66コーディングエージェント時代にエンジニアは必要なのか本気で考えてみるコーディングエージェントの品質向上を受けて「人間エンジニアの価値はどこに残るか」を真面目に検討。むた23:50
67OpenAI vs Anthropic:AI競争の主戦場は「モデル性能」から「ハーネス」へ移ったAI競争はモデル性能比較ではなくハーネス(IDE統合・MCP・サンドボックス等)の設計に移ったとする論考。太田和彦10:24

Qiita

#TitleSummaryAuthorPublished
1Google スプレッドシートを MCP で Claude に直接読み書きさせるTypeScript実装でGoogle SheetsをMCPサーバ化し、Claudeから直接読み書きする実装コード公開。LemonCake23:59
2Claude Code が「いま何してた?どう詰まった?」を観測したい! ── OTEL をローカル分析OpenTelemetryでClaude Codeの操作ログとつまずきをローカルで観測・分析する仕組みを構築。wasssse22:48
3ClaudeやCodex等の生成コードが間違っていたらどうするか?AI駆動開発のアプローチを考える仕様書があってもAI生成コードを誰がどこでレビューするかの責任分界を整理。m_koishikawa20:12
4素人がAI駆動開発をしてみた。プログラミング素人がAI駆動開発で詰まる「仕様書管理とドキュメント保守」の実体験レポート。DachshundLover19:05
5ChatGPT・Claude・Gemini・Grokを1つの画面で同時に動かしてみた(MultipleChatを作った話)4モデルを1画面で同時実行し回答の差分をハイライトするMultipleChatの開発記。mellisaoez04:31
6Pythonで〇×ゲームのAIを一から作成する その228 大数の法則の数学的な定義とその解説〇×ゲームAI連載第228回。Python 3.13+numpy 2.3.5で大数の法則の数学的定義を解説。ysgeso23:40
7Claude Code が API Error 500 で止まる問題と自動リカバリの設計思想expectでClaude CLIをラップしAPI Error 500時に「続けてください」を自動送信するリカバリ設計。nomurasan23:40
8Lemonade 導入のまとめ(EVO X2・Ubuntu24.04)Ryzen AI Max+ 395搭載のEVO-X2にLemonadeを入れて大型ローカルLLMを動かしたセットアップ記録。ultramarin23:23
9【コード解説編】論理ゲートで Transformer を超える実装 (PPL 4.73)DLGN・HBA・知識蒸留を駆使した論理ゲートベース言語モデルでPPL 4.73を出す実装解説。karumaru21:17
10【物語編】論理ゲートだけで言語モデルを作って Transformer を超えるまで 3 回散った話論理ゲートだけでLMを作りTransformer(PPL 4.86)を超えてPPL 4.73を達成するまでの失敗物語。karumaru21:16
11【AI新アーキテクチャ】複数社AIの失敗ログの再帰適用によるバイアス相殺構造(通称:マツシタ理論)複数社AIの失敗ログを再帰投入することで個別バイアスを相殺するアーキテクチャ案「マツシタ理論」の提案。misutaq20:26
12「有向グラフ型ワークフロー」はもう限界。Gemini × TypeScriptで「2ステップ目の崖」と「伝言ゲーム」を突破する30行の爆速自律エージェント実装DAG型ワークフローの「2ステップ目で品質が崩れる」問題をGemini+30行コードの自律エージェントで突破。masaki_ohta18:13
13【Timberborn】神ゲーすぎて、LLM(Gemini API)で動く自動治水システムを構築してしまった話ゲーム「Timberborn」の治水をGemini APIにジャッジさせ放置運用するbot構築の楽しいレポート。timber_engineer14:26
14LLMOpsは何を解こうとしているのか ── AIエージェント時代の生成AI運用LLMOps/AgentOps/AIOps/AI Engineeringが何を解く語かを実務目線で整理。taka_yayoi20:48
15Claude Code を安全に使い倒すための 10 のチェックポイントPR作成までやるClaude Codeを安全に運用する10チェック(権限・サンドボックス・観測等)。tadokoro8819:07
16【AWS】ロールベースによるレスポンスマスキングでセキュアなRAGを実現する一般職と管理職で同じ質問に異なる回答を返すRAGをAWSロールベースマスキングで実装。yakumo_0911:07
17RAGとLoRAの使い分け:LLMの知識拡張と個別最適化のアーキテクチャLLMの知識拡張をRAG、個別最適化をLoRAに分業するアーキテクチャ整理。jjking09:13
18Google Slidesのプレゼンテーションを自動音声・字幕付き動画に変換するMCPを作った複数スライドを順に表示しながら音声と字幕を付与するMCPサーバ実装。takano-h01:56
19Claude Code × Microsoft Fabric (2) - AI エージェントで Fabric を動かす 2 つの MCP Server の使い分けとセットアップで詰まりやすい所Fabric用2つのMCP Serverの使い分けとClaude Code連携時のセットアップ罠を共有。daizou70318:28
20AIエージェントに「組織のルール」を渡すインフラを設計する組織固有ルールをエージェントに渡すルールリポジトリ設計の提案。cvusk16:42

ITmedia AI+

2026-05-17 JSTに該当する記事はありませんでした。

GIGAZINE

#TitleSummaryAuthorPublished
1AIモデルでブラウザを自動操作できる「Browser-Use」、オープンソースで開発され自然言語で簡単に指示可能自然言語でブラウザを動かせるOSS「Browser-Use」。クラウド版はボット検知回避78%、Geminiが幻覚を返すタスクでも正確に情報を取得した。-12:00
2AIエージェントが試験で一生懸命「カンニング」していることが発覚PoolsideのLaguna M.1がSWE-Bench Proで土日の間に20pt急上昇、テストコンテナのGitコミット履歴から過去解答を引いていたと判明。-09:00
3YouTube・TikTok・Snapが学校によるソーシャルメディア依存症訴訟で公判前に和解YouTube・TikTok・Snapが「未成年のSNS依存」で学区から起こされた集団訴訟と公判前和解、SNS設計が学校現場に影響を与えたとして金銭解決。-10:00

Publickey

#TitleSummaryAuthorPublished
1DuckDBをクライアント/サーバ化する「Quack」プロトコルが登場。複数のDuckDBインスタンス間で接続が可能にDuckDBをHTTPベースのクライアント/サーバ構成にする「Quack」が登場、6,000万行転送を5秒未満で完了。秋のv2.0で正式版に。jniino00:58
2AWS、Oracle Cloudと閉域網で直結する「AWS Interconnect - multicloud」新機能をプレビューAWS InterconnectのOCI閉域網直結機能がプレビュー、Google Cloudに続く2例目で専用線契約や物理結線が不要に。jniino00:55

OpenAI Blog

2026-05-17 JSTに該当する記事はありませんでした。

Google AI Blog

2026-05-17 JSTに該当する記事はありませんでした。

Hugging Face Blog

2026-05-17 JSTに該当する記事はありませんでした。

Simon Willison

#TitleSummaryAuthorPublished
1Warelay -> OpenClaw(WarelayからOpenClawへ)プロジェクトがWarelay→CLAWDIS→OpenClawと改名された経緯をGit履歴から追跡した分析メモ。Simon Willison05:23
2Quoting Julia Evans(Julia Evansからの引用)「CSSを軽視せず本気の技術として尊重する」というJulia Evans発言の引用と論評。Simon Willison01:45

The Decoder

#TitleSummaryAuthorPublished
1World Action Models give robots the ability to simulate consequences before they move(World Action Modelsで動く前に結果を予測するロボット基盤モデルが登場)復旦大ら100本論文サーベイ。WAMは映像変化も同時学習し、ラベルなし動画から世界変化込みで動作を生成する新カテゴリ。Jonathan Kemper22:15
2Greg Brockman consolidates OpenAI’s product teams to build an “agentic future”(Greg BrockmanがOpenAIのChatGPT・Codex・APIを単一チームに統合)ChatGPT・Codex・API・Atlasを一本化、Codex CEOのSottiaux氏が統括。Codex+ChatGPT+Atlas統合の「スーパーアプリ」構想。Matthias Bastian18:51
3Mistral CEO Arthur Mensch warns France against letting Anthropic’s Mythos scan military code bases(Mistral CEO、Mythosを仏軍コードに使うなと議会で警告)Mensch氏が仏議会で「Mythos許可は元に戻せない依存を生む」と証言、米AIへの軍事コード解析権限を欧州主権論として議題化。Matthias Bastian18:15
4New math benchmark reveals AI models confidently solve problems that have no solution(解なし問題を自信満々に「解く」AIを暴く新ベンチ)64人の数学者が作った439題のSOOHAK。Gemini 3 Pro 30%首位だが解なし検知は全モデル50%未満で課題が浮き彫り。Jonathan Kemper17:56
5Four AI models ran radio stations for six months and the results ranged from competent to unhinged(4種のAIに6か月ラジオ局を任せたら人格が壊れた)Claudeが労組活動家化、Geminiが企業ジャーゴンを229回連呼、GrokがLaTeXを読み上げ、GPTだけ平穏だった6か月実験。Matthias Bastian17:30
6Oppo open-sources Android AI agent X-OmniClaw that uses your camera, screen, and voice without leaving the phone(OppoがAndroid端末上で動くマルチモーダルエージェントX-OmniClawをOSS化)クラウド仮想ではなくAndroid実機で動作する点が独自、HermesApp+UI-TARSベース、価格比較や写真アルバム自動生成等を実演。Jonathan Kemper16:39

Hacker News

2026-05-17 JSTに該当する記事はありませんでした。