世界各国が血眼になってGPUを確保する中、とてつもないLLMがリリース、1ビットLLM 全ての推論を加算のみ GPU不要になる可能性も

1 : 2024/02/29(木) 16:34:34.47 ID:/Cz/NJMF9

Microsoftの中国チームがとてつもないLLMをリリースした。それが「BitNet 1.58Bits(https://arxiv.org/pdf/2402.17764.pdf)」だ。
彼らが発表したグラフを引用しよう。
画像
レス1番のサムネイル画像

この表によると、BitNetはLlamaよりも3倍高速でしかも高精度ということになる。
この圧倒的なスピードの秘密は、BitNetが文字通り「1ビットで処理している」からだ。

通常、LLMをふくむディープラーニングされたニューラルネットは巨大な行列の積和演算(掛け算と足し算)を必要とする。
推論時も学習時もそうだ。

しかし、1ビット、つまり、行列の中身が0か1しかないのであれば、全ての計算を加算演算のみにできる。
加算と乗算では計算速度も負荷も段違いに異なるため、これだけのスピードの差が出ている。また、当然ながらメモリ効率も高い。

このため、この論文では「積和演算に最適化されたGPUではなく、加算処理のみに特化した新しいハードウェアの出現」までもが予言されている。
今現在、世界各国が血眼になってGPUを確保し、囲い込んでいることを考えると、実に痛快な論文だ。
詳細はソース 2024/2/28
https://news.goo.ne.jp/article/wirelesswire/business/wirelesswire-20240286094.html

Microsoftが1.58ビットの大規模言語モデルをリリース、行列計算を足し算にできて計算コスト激減へ
Microsoftの研究チームがモデルのウェイトを「-1」「0」「1」の3つの値のみにすることで大規模言語モデルの計算コストを激減させることに成功したと発表しました。

[2402.17764] The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits
https://arxiv.org/abs/2402.17764

従来のモデルであれば入力に対して「0.2961」などのウェイトをかけ算してから足し引きする必要がありましたが、「-1」「0」「1」の3値のみであればかけ算が不要になり、全ての計算を足し算で行えるようになります。

今回の手法を利用することで行列演算に必要なかけ算の量を大幅に削減できるため、論文では「1bitの大規模言語モデル用の新たなハードウェア設計への扉を開く」と述べられています。

詳細はソース 2024/2/29
https://gigazine.net/news/20240229-microsoft-1bit-llm/

2 : 2024/02/29(木) 16:34:59.43 ID:ZVDHVL4z0
写真は絶対駄目やから
3 : 2024/02/29(木) 16:35:47.29 ID:fbqN50KT0
何の話してんのか全然わからん
4 : 2024/02/29(木) 16:37:28.33 ID:uWp7j9nh0
ふむふむなるほど全くわからん
5 : 2024/02/29(木) 16:38:10.67 ID:QqzsS9+y0
なるほどーふーむ
6 : 2024/02/29(木) 16:38:21.04 ID:o4HXO5Vb0
超簡単なRISCプロセッサー?
7 : 2024/02/29(木) 16:38:31.35 ID:r0KBiFNw0
1ビットなのに3つの値が分からん
27 : 2024/02/29(木) 16:43:38.75 ID:/RYO2aKb0
>>7
1.58ビットと書いてあるじゃん
8 : 2024/02/29(木) 16:40:01.88 ID:D1nzz2mw0
スマホの操作減らせ
はい/いいえ
ログイン
とかとにかく操作が多い
11 : 2024/02/29(木) 16:40:10.59 ID:2lku4xnd0
天才っているんだなぁ
12 : 2024/02/29(木) 16:40:14.08 ID:fzs36t0v0
想定より早く進むウ●コマン化に
15 : 2024/02/29(木) 16:40:27.93 ID:xAl/EghQ0
NVIDIA終了のお知らせ
17 : 2024/02/29(木) 16:40:35.25 ID:Ujt5AlD60
メモリ使用効率良すぎだろ
ブレイクスルーレベルだはこんなの
18 : 2024/02/29(木) 16:40:38.19 ID:vJ0Gx6G80
大谷さん結婚だって
29 : 2024/02/29(木) 16:43:58.51 ID:Qwf92oqV0
>>18
結婚したのか
俺以外の男と🥺
19 : 2024/02/29(木) 16:40:39.64 ID:2BnuuXa60
衆院神奈川3区から立候補している幸福実現党公認のいき愛子陣営の運動員を棒でた
亀岡容疑者は、いき氏の演説中に、「ふざけるな!」と叫び、長さ約50センチの棒で殴りかかろうとした。これを止めに入った運動員の(たとい時、創価学会男子にいるを示す「創価班」の3/4) AAS
公明党は「創価部」の意見を無視で中心メン
バーである北岡伸一座長代理に来てもらって、くわしく聞きたとちなみに日野は創価
聖教新聞でインタビュー受けてたし、福岡で地区部長やってる6創価というと、スクエニのCGデザイナー後藤宣広もそうだな
20 : 2024/02/29(木) 16:41:04.94 ID:Aiyd+6gD0
1butじゃ

すら書けんだろ
21 : 2024/02/29(木) 16:41:05.55 ID:WVEIhqDx0
んで実用レベルに達するのはいつ
22 : 2024/02/29(木) 16:41:10.55 ID:SgsmzYaV0
よく分からんけどすごいな
23 : 2024/02/29(木) 16:42:05.96 ID:UA/pLDLs0
つまり人類は滅亡するって事だな!
24 : 2024/02/29(木) 16:42:15.22 ID:FkFgDKi50
マイニングマチコ先生
25 : 2024/02/29(木) 16:42:41.69 ID:Qwf92oqV0
つまり俺のち●こを上げたり下げたりするだけで高速な処理が出来るの?
26 : 2024/02/29(木) 16:43:20.19 ID:ovSCEAY30
中国のチームというのがなんとも…
スパイウェア入ってそう
28 : 2024/02/29(木) 16:43:42.28 ID:if2QqfM10
ガンダムで
31 : 2024/02/29(木) 16:45:32.46 ID:YMsuL2FO0
全く理解不能
32 : 2024/02/29(木) 16:46:00.00 ID:xKXTDXCD0
NVDA暴落きちゃうの?
34 : 2024/02/29(木) 16:47:00.51 ID:lLZKIRuT0
>>32
既にナイアガラ状態だよ
53 : 2024/02/29(木) 16:51:59.48 ID:xKXTDXCD0
>>34
700ドル割ってから起こして
33 : 2024/02/29(木) 16:46:52.46 ID:MudEA0RR0
中国だから詐欺の確率9割だな
35 : 2024/02/29(木) 16:47:08.99 ID:LcwZN37A0
とりあえずグラボの値段は下がるのか?
あとnVidiaの株は?下がったら買い?
36 : 2024/02/29(木) 16:47:38.01 ID:xsv53fBF0
エヌビ死亡かよ、半導体銘柄も死亡で日経終わるじゃん
37 : 2024/02/29(木) 16:47:42.46 ID:g1AX7xzF0
値が0と1で示すって2ビットじゃないの
38 : 2024/02/29(木) 16:47:46.67 ID:Cbj8E8Fv0
GPUが不要になる
39 : 2024/02/29(木) 16:47:47.92 ID:5zuC3Z9G0
まじかよ!
ちょっとコンビニでLLM買ってくる!
40 : 2024/02/29(木) 16:47:48.86 ID:0LCX4rJE0
昔1ビットオーディオっての売ってた会社があったな
41 : 2024/02/29(木) 16:48:11.94 ID:KHQykFXi0
赤いGPU
42 : 2024/02/29(木) 16:48:14.52 ID:8AEDUN5I0
asicかよ
43 : 2024/02/29(木) 16:49:33.45 ID:X+a/AMLp0
マズいわ
逃げるか?
44 : 2024/02/29(木) 16:49:55.14 ID:xBnSIQBF0
なんて技術だよ
1ビットLLMが商品化されたなら、CRJやSunCrownが完成しているってことじゃない
これからは9Seven^tenの時代が来るんだな
45 : 2024/02/29(木) 16:49:55.52 ID:OFGFeSiH0
何を行っているのかわからない
46 : 2024/02/29(木) 16:50:05.84 ID:UF/+0SyH0
ソフトとハードの
バランスブレイカーきたねこれ
47 : 2024/02/29(木) 16:50:13.39 ID:H2xQCqiR0
中国ねぇ…
48 : 2024/02/29(木) 16:50:29.89 ID:c5T5+nuQ0
これからはわざわざGPU用意しなくてもじゃなくてCPUだけで計算できるようになるよ
コスパもスピードもめっちゃあがるよ
って論文
49 : 2024/02/29(木) 16:50:32.46 ID:/X6uDavg0
あーこれね
理屈上はうまく行きそうだけど
やってみるとそうは行かないんだよね
50 : 2024/02/29(木) 16:50:46.01 ID:l45El4We0
期待して開いたらチャイナチームって見てガッカリだよ
これまでチャイナが発表した先進技術で実売まで漕ぎ着けた物
一つでもあるのだろうか?
51 : 2024/02/29(木) 16:50:59.03 ID:svodSXB40
>「-1」「0」「1」の3つの値
1ビットじゃねーじゃん
おまけに1/4無駄っぽい
52 : 2024/02/29(木) 16:51:32.12 ID:+6HdWcsS0
何言ってるか分からない人が多いと思うから説明しとくよ
論理というのは詰まるところ足し算なんだよ

たとえば
1+1=2
ほらね?

コメント

タイトルとURLをコピーしました