anchortagというブログを書いています。でも、最近は、このツイートの表示部分のみ更新されています。
Web版「Google Earth」に「フライト シミュレータ」 米Googleは6月12日(現地時間)、地球儀アプリ「Google Earth」のWeb版に「フライト シミュレータ」機能を追加した。現在、すべてのユーザーにグローバル展開中。 「フライト シミュレータ」は、飛行機を操縦して「Google Eart...
Windows Latestは6月5日(現地時間)、「Watch: Microsoft shows off how AI features can customize your Windows 11 entirely with one sentence」において、AIエージェントによるWindows PCカスタマ...
2026年6月10日、Googleがオープンモデルの「DiffusionGemma」を公開しました。DiffusionGemmaは主流の自己回帰モデルではなく拡散言語モデルであり、高速応答が求められる分野での活躍が期待されています。DiffusionGemma: 4x faster text generation...
MiniMaxは6月12日、総パラメータ数が約4,280億でマルチモーダル対応のオープンウェイトLLM「MiniMax M3」のモデルウェイトをHugging Faceで公開した。アクティブパラメータ数が約230億のエキスパート混合モデル(MoE)アーキテクチャを採用する。ソフトウェアエンジニアリング評価「SWE...
AIを利用してWebアプリを作成する場合、FirebaseやSupabaseなどのバックエンドサービスを利用することが多いですが、これまで管理画面でユーザーの操作が必須だったほとんどの作業をコーディングAIエージェントが直接行える様に拡張したオープンソースのバックエンドサービス「InsForge」が公開されていま...
栃木県茂木町でドローンの販売・教習、システム開発を手がける「NSi真岡」が、クマ検知機能を備えたソフトを開発した。同社が取り扱う最新型のドローンに搭載されたAI(人工知能)検知機能を活用し、空中から高倍率ズーム付き可視光カメラで山林や田畑にいるクマを探知する仕組みだ。(大屋敷英樹) クマを探知すると、ドローンの送...
音楽ストリーミングサービスのDeezerが、YouTube Music・Spotify・Apple Musicなどの他サービスで作成したプレイリストをスキャンして、プレイリストに含まれているAI生成音楽を検出できる無料サービスをリリースしました。Deezerの無料AI 音楽検出機能|AI 曲チェッカーhttps:...
Googleは9日(米国時間)、ほぼリアルタイムの音声対音声翻訳に対応する音声モデル「Gemini 3.5 Live Translate」を発表した。70以上の言語を自動検出し、話者のイントネーション、ペース、ピッチを保った翻訳音声を生成する。 一般向けにはAndroidおよびiOS版のGoogle 翻訳アプリで...
クリエイターに人気の高いマルチモーダルAIプラットフォーム「ElevenLabs(イレブンラボ)」。もともと音声クローン技術などに強いだけに、音楽生成にも力を入れていたのですが、6月1日に発表された最新のAI音楽生成モデル「Music v2」はかなり強力です。 高度なアレンジに対応 Music v2はただ音楽を生...
Shisa.AIは6月11日、リアルタイム翻訳アプリ『Chotto Chat』をiOSおよびAndroid向けにリリースしたと発表しました。日本語・英語・中国語の3言語に対応しており、ブラウザからも利用できます。 『Chotto Chat』の特徴 『Chotto Chat』は、最大25名での同時利用に対応したリア...
AI開発企業のZyphraが視覚言語モデル(VLM)の「Zamba2-VL」を公開しました。Zamba2-VLは同規模モデルと比べて高速な画像認識処理が可能です。Zamba2-VL: Hybrid SSM Vision-Language Modelshttps://www.zyphra.com/our-work/...
Z.aiは6月13日、コーディングと長期エージェントタスクに特化したAIモデル「GLM-5.2」を公開した。最大100万トークンのコンテキストウィンドウに対応し、1回の応答で生成できる出力トークン数は最大128K(131,072トークン)となる。GLM-5.2の詳細なアーキテクチャやベンチマーク数値は本稿執筆時点...
NotebookLMが包括的なアップグレードを実施し、複雑な研究プロジェクトに対応する新機能を提供します。Gemini 3.5とAntigravityにより、正確性と信頼性の高い応答に加え、思考過程の可視性が強化されました。安全なクラウドコンピュータを各ノートブックに搭載し、コードの生成と実行を通じて大規模分析を...
Obsidianのようなノートアプリを使い込むほどプラグインや自動化ワークフローの管理が増え、ノート整理自体が目的になってしまうことがあります。機能を意図的に絞り込み、ブラウザだけで動作しPWAとして無料で使えるうえ、クラウドストレージやセルフホストサーバーを通じたデバイス間同期にも対応したオープンソースの「Fi...
天体の位置や動きなどを社会や個人の性質などと結び付けて占う「占星術」は古代バビロニア発祥とされ、現代でも根強く愛されています。科学的研究によると占星術と社会の出来事や人間の性格を結び付ける証拠は一切見つかっていないにもかかわらず、古代から現代にわたって占星術が求められ続けている理由について、アメリカのコーネル大学...
うつ病は世界中で数億人が罹患(りかん)しているとされる精神疾患であり、近年は運動や日々の食習慣といった生活要因が、うつ病の症状緩和や治療に役立つ可能性が注目されています。韓国の研究チームが行った新たな研究では、食事の時間が不規則な人ほどうつ病の症状が現れる可能性が高いことがわかりました。Irregular mea...
米Anthropicが6月9日(現地時間)にリリースした新たなAIモデル「Claude Fable 5」。すでにその“賢さ”は大いに話題だ。記者も早速触っているが、これまでのハイエンドモデル「Opus」に比べても体感的な賢さは歴然だ。 ところで、Fable 5が利用できるAIチャットサービス「Claude」には、...
ブレイン・マシン・インターフェイス(BMI)を手がける中国のユニコーン企業「強脳科技(BrainCo)」がこのほど、高性能な多指ロボットハンドを発表した。 BrainCoは「障害のある方が再び『手を使えるように』支援するところから、ロボットも『手を使えるように』するーー。これは決して異分野への進出ではなく、同じ技...
Google DeepMindは3日、マルチモーダルAIモデル「Gemma 4 12B」を発表した。ノートPC上で動作するエージェント型マルチモーダルAIを想定したモデルで、16GBのVRAMまたはユニファイドメモリーでローカル実行できる。Apache 2.0ライセンスで提供されるオープンモデルで、開発者はHug...
グーグルは9日(現地時間)、70以上の言語を自動検出してリアルタイムに翻訳する音声モデル「Gemini 3.5 Live Translate」の提供を開始した。話者の声のトーンやペースを保ちながら連続的に翻訳を生成し、自然な対話を実現する。 自然な対話を実現する連続翻訳 「Gemini 3.5 Live Tran...