一、依据数码发展部115年1月12日数码资创决字第1153000040号函办理。
二、为推动台湾主权AI发展,数码发展部打造「台湾主权AI训练语料库」(下称语料库),广纳高品质正体中文语料,支援AI模型训练更贴近台湾语言、文化与生活情境,促进AI模型具备更高的本土辨识力与语意理解能力。
三、语料库目前已逾200个政府机关投入,上架累计超过3,000笔资料集,语料规模超过10亿词元(token)并持续扩充,收录内容为各机关具台湾文化特色之高品质资料集,涵盖语言、文化、交通、教育、生物、地理环境等领域。
四、欢迎有AI模型训练需求之机关(构)、公私法人、研究机构、学校、非法人团体或自然人申请使用,用台湾的语料,打造理解台湾的AI!
