人工知能

IT

TurboQuantの仕組みを整理 PolarQuantとQJLでKVキャッシュを圧縮するGoogleの新手法

Googleは、大規模言語モデル(LLM)のメモリ消費量を最大6分の1に削減する新技術「TurboQuant」を発表しました。PolarQuantとQJLを組み合わせることで、精度を維持しつつKVキャッシュを3ビットまで圧縮します。本稿では、技術の概要と計算速度への影響について解説します。
IT

AnthropicのClaude Mythosとは?下書き流出で判明した未公開AIモデルの現状

AI企業Anthropicが、開発中の新型AIモデル「Claude Mythos」の存在を認めました。ブログ記事の下書きが一時的に公開状態となっていたことで判明したもので、同社は現在一部の顧客を対象にテストを実施していると説明しています。現時点で公開されている情報の範囲と、今後の展開について整理します。
IT

Dreamina Seedance 2.0とは?CapCutで始まった動画生成AIの特徴と利用時の注意点

ByteDanceは、動画編集ツール「CapCut」において、新たな動画生成AI「Dreamina Seedance 2.0」の提供を開始しました。著作権に関する懸念が指摘される中での展開となります。本記事では、発表された機能の概要と、今後の展開について現時点で判明している事実を整理して解説します。
IT

Sakana AIのSakana Chatが一般公開、無料で使えるNamazu(α版)の概要

日本に拠点を置くAI企業Sakana AIが、日本市場向けに最適化した試作モデルシリーズ「Namazu」を搭載したチャットサービス「Sakana Chat」を公開しました。同サービスは無料で利用可能であり、日本語環境への適応を重視した設計が特徴です。本記事では、公開されたサービスの概要と特徴を整理します。