谷歌与李飞飞的斯坦福团队携手推出了基于Transformer的视频生成模型W.A.L.T,标志着2023年成为AI视频元年。该模型利用因果编码器和窗口注意的变压器架构,成功将图像和视频
2023-12-13 阅读全文
华中科技大学官方发文称,该校软件学院一团队发布了多模态大模型Monkey”。该模型擅长图像描述和视觉问答,能够实现对世界的观察”,对图片进行深入问答交流和精确描述。值
2023-12-12 阅读全文
领先的SaaS云银行平台Mambu发布了其2024年度合作伙伴预测报告,深入探讨了未来一年金融领域的趋势,并研究了银行、企业和金融机构如何应对这些变化的方式。该报告由包括AWS
2023-12-12 阅读全文
近期一项前沿的类脑研究登上了Nature子刊,研究人员利用活人脑细胞构建了一个新型AI系统,这一突破意味着语音识别准确率有望大幅提升。这个系统可以进行无监督学习,并具有
2023-12-12 阅读全文
《GoogleGemini》是Alphabet于2023年12月6日发布的下一代AI模型的首个阶段。这个AI系统由GoogleDeepMind团队主导,旨在超越人类专家在多任务语言理解方面的表现,能够根据不
2023-12-12 阅读全文
春节即将来临,抖音上的知名博主“插秧人”以其独特的创意和AI技术,成功打造了一组富有中式春晚氛围的图像。这些由AI生成的图像看似正常,然,在博主发布一系列指令后,图
2023-12-12 阅读全文
DreaMoving是一款基于扩散模型的视频生成工具,可用于生成高保真度的定制人类舞蹈视频。用户只需提供目标人物的身份信息和舞蹈动作序列,DreaMoving即可根据这些信息生成一
2023-12-12 阅读全文
《screenshot-to-code》是一个简单的应用程序,使用GPT-4Vision生成代码,并使用DALL-E3生成类似的图片。这个应用程序具有React/Vite前端和FastAPI后端,用户需要访问GPT-4
2023-12-12 阅读全文
澳大利亚初创公司RelevanceAI推出了一款低代码平台,旨在帮助企业建立自定义AI团队,提高生产力。该平台已成功筹集1000万美元的A轮融资,由KingRiverCapital领投,全球投资
2023-12-12 阅读全文
文心一言是百度开发的聊天机器人,能够与人互动、回答问题及协作创作。它具备跨模态、跨语言的深度语义理解与生成能力,可以在搜索问答、内容创作生成、智能办公等众多领域
2023-12-12 阅读全文