2025-11-21 02:40来源:本站

多哈:卡塔尔首个以阿拉伯语为中心的大型语言模型人工智能平台“Fanar”在半岛电视台于2025年1月11日星期六举行的第二届人工智能媒体会议的第一天登台亮相。
会议汇集了来自卡塔尔计算研究所的技术专家和创新者,他们在那里进行了丰富的对话,并展示了当地开发的平台。
卡塔尔计算研究所执行主任Ahmed K Elmagarmid博士解释说:“我们不是在与ChatGPT或Gemini等大型语言模型竞争。”
卡塔尔计算研究所执行主任Ahmed K Elmagarmid博士在第二届AI in Media Co由半岛电视台媒体研究所于2025年1月11日星期六举办的会议。图片来源:Oussama Abbassi
“我们的目标是填补一个关键的空白——在人工智能开发中缺乏对阿拉伯语的关注。”
阿拉伯语人工智能平台代表了海湾地区从技术消费者到人工智能领域创新者的重大转变。
该项目于2024年初启动,是卡塔尔计算研究所、哈马德·本·哈利法大学和通信和信息技术部共同努力的结果,得到了卡塔尔国家图书馆、阿拉伯研究与政策研究中心、半岛电视台和捐赠与伊斯兰事务部(Awqaf)等卡塔尔各机构的支持。
卡塔尔计算研究所首席科学家Mohamed Eltabakh博士强调了Fanar的独特之处。
卡塔尔计算研究所首席科学家Mohamed Eltabakh博士在媒体公司第二届人工智能大会期间由半岛电视台媒体研究所于2025年1月11日星期六举办的会议。图片来源:Oussama Abbassi
“法纳尔的独特之处在于,它是一种卡塔尔本土技术,恰当地反映了阿拉伯社会和文化。”
他演示了该平台如何使用阿拉伯名字和文化参考来生成内容,这与默认以西方为中心的西方人工智能模型不同。
该团队解决的一个关键挑战是网上阿拉伯语内容的稀缺。
尽管说阿拉伯语的人占互联网用户的6%,但阿拉伯语内容只占在线内容的不到0.5%。
为了克服这个问题,Fanar在一个包含40%阿拉伯语内容的数据集上进行了训练,这一比例明显高于其他人工智能模型。
该平台包括专门用于宗教内容、图像生成、方言处理和事实验证的组件。
“我们开发了自己专门为阿拉伯语设计的标记器,而不是使用现成的技术,”埃尔马格米德博士补充说,并强调他们致力于构建阿拉伯语原生人工智能解决方案。
Fanar代表了卡塔尔更广阔的愿景,即在保持文化真实性的同时,增强阿拉伯语数字内容,并满足阿拉伯语用户和组织的特定需求。