なんJLLM部 避難所 ★8
今gpt-ossが出て騒いでる人って明らかに他のOSSモデルを知らなかった人だよね
エンジニアにすらChatGPTのブランドで発信されないと情報が届かない層がいると知ったよ >>883
あの辺のプロ驚き屋は知ってても一時的に記憶消して驚くよ 業務でqwenやdeepseek使うのは通せる気がしないけど、
gpt ossなら通せるのが大きい
mistral とかでもいいんだろうけど知らなそうだし、
国産はゴミ 国産最強はkarakuri70b v0.1だったな
以後のkarakuriはパッとしなかったが LlamaやMistralのモデルをファインチューニングした物を国産って言うの辞めてもらえないかね
プレスリリースでも元の学習に使ったモデルを書かないのは卑怯だし、そういう手口が日本のLLMを貶めてる
明らかに産地偽装なのにそれで金集めるのって詐欺だろ 基盤モデルの研究開発ってNTTとNIIくらいしかやってないし商業でまともに戦えるプロダクトにしようとすると数百億円はかかるからどこもやれないんだよな >>888
日本のモデル全部それだろ😅
pfnは違うけど弱いし 個人勢ののべっちが一番商業的に成功してる国産LLMの時点でね
何なら小説の自然な続きを書く性能だけならトップまであるし 国産フルスクラッチだとなんやかんやサイバーのcalm3が一番強かったなー
次バージョンは作らないのかな 公共ないし三セクが主導しないと営利企業にやらせるのはコストとリスク的に無理があるからなぁ いくらかでも脱アメリカしとかんとどうなるかわからんからな