まとメディア明日の話題、まとメディア

従来の大規模言語モデルの制約だった入力量の限界を取り払ったRWKVは一体どんな言語モデルなのか

従来の大規模言語モデルの制約だった入力量の限界を取り払ったRWKVは一体どんな言語モデルなのか

目次

1. 従来の大規模言語モデルの制約だった「入力量の限界」を取り払った「RWKV」は一体どんな言語モデルなのか？

従来の大規模言語モデルの制約だった「入力量の限界」を取り払った「RWKV」は一体どんな言語モデルなのか？

ChatGPTやBardなど、2023年7月時点で商用利用されている大規模言語モデルはほとんど全てがトランスフォーマーというアーキテクチャを利用したモデルですが、トランスフォーマー型のモデルは入力の長さの2乗に比例して計算量が増加するため、入力サイズが制限されてしまう問題があります。そうした問題に応えて、大きいデータへの対応や推論時のメモリ使用量の削減を達成しつつトランスフォーマー型に匹敵する性能を出せるアーキテクチャ「RWKV」について、著者の一人がブログで解説しています。

続きを読む…

続きを見る

関連する記事

Steamでプレイ中のゲームを個別にフレンドから隠すプライベート機能が間もなく登場か 2023.11.09

目次 1. Steamでプレイ中のゲームを個別にフレンドから隠すプライベート機能が間もなく登場か Steamでプレイ中のゲームを個別にフレンドから隠す[…]
一瞬だけ公開されたTwitterに似た競合アプリThreadsのAndroid版を調査して明らかになったこととは 2023.07.05

目次 1. 一瞬だけ公開されたTwitterに似た競合アプリ「Threads」のAndroid版を調査して明らかになったこととは？一瞬だけ公開された[…]
「Google Chrome 122」安定版リリース、ストレージのバケットごとに永続化を選択する設定やメインスレッドのイベントの原因をトラッキングすることが可能に 2024.02.21

目次 1. 「Google Chrome 122」安定版リリース、ストレージのバケットごとに永続化を選択する設定やメインスレッドのイベントの原因をトラ[…]

おもしろカテゴリの最新記事