公告
设置
定位中··· -
欢迎查看 2024 新闻时间线
富士通等发布增强日语能力的大模型 Fugaku-LLM
更新于 2024-05-11 18:49:15
日本东京工业大学、理化学研究所、富士通等发布增强日语能力的大模型 Fugaku-LLM,移植了 Megatron-DeepSpeed 深度学习框架,源代码托管在 GitHub 上,公众可通过 Fujitsu Research Portal 网站试用。Fugaku-LLM 有 130 亿参数,日语 MT-Bench 平均分 5.5,其人文和社会科学得分高达 9.18 分。Fugaku-LLM使用了日本最强大的 ARM 超算富岳进行了训练。

赞助商广告