2023-01-01から1年間の記事一覧
中国系の多言語LLM、Yi-34B-Chat Yiシリーズは中国のAIベンチャー「01-ai」が開発した言語モデル。まだ試してなかったのを思い出して簡単に動かしてみました。 一般向けGPUで実用的に動かせるモデルの中では、Mixtral-8x7Bと並んで性能が高いようです。 Chat…
">「llama2.c」を試したときに「TinyStories(小さな物語)」というデータセットの存在に興味を持ったので少し調べてみました。 "> note.com "> ">タイトルは「TinyStories: How Small Can Language Models Be and Still Speak Coherent English?」。著者はR…