【AiBase提要】站长之家(ChinaZ.com)1月4日 消息:近期,GPT-4V的开源替代方案在中国的顶尖学府清华、浙大等的推动下,出现了一系列性能优异的开源视觉模型。其中,LLaVA、CogAgent和BakLLaVA是三种备受关注的开源视觉语言模型。1. Nvidia将更加努力成为云提供商,与亚马逊、微软和谷歌之间的关系愈发复杂。
论文网址:https://arxiv.org/pdf/2401.00431.pdf
论文地址:https://aclanthology.org/2023.findings-emnlp.157.pdf