2023-01-01から1年間の記事一覧

Yi-34B-Chatを日本語で試す

中国系の多言語LLM、Yi-34B-Chat Yiシリーズは中国のAIベンチャー「01-ai」が開発した言語モデル。まだ試してなかったのを思い出して簡単に動かしてみました。 一般向けGPUで実用的に動かせるモデルの中では、Mixtral-8x7Bと並んで性能が高いようです。 Chat…

【LLM論文を読む】小さな物語 - 小規模モデルで流暢なテキストを生成する

">「llama2.c」を試したときに「TinyStories(小さな物語)」というデータセットの存在に興味を持ったので少し調べてみました。 "> note.com "> ">タイトルは「TinyStories: How Small Can Language Models Be and Still Speak Coherent English?」。著者はR…