多模态大模型

末蓝、 2024-02-05 23:06 20阅读 0赞

发表评论取消回复

表情：

评论列表（有 0 条评论，20人围观）

还没有评论，来说两句吧...

相关阅读

相关 Sora爆火，多模态大模型背后的存算思考

近日，随着OpenAI推出Sora，人工智能从文本到文本、文本到图片的生成模式，进阶到文生视频。其文本到视频的模型能够生成长达一分钟的视频，在保持视觉质量的同时并严格遵循...

╰+哭是因爲堅強的太久メ/ 2024年04月22日 19:33/ 0 赞/ 60 阅读

相关多模态模型：概述

![format_png][] 多模态模型是一种机器学习模型，它可以同时处理多种不同类型的数据，例如文本、图像、声音或者视频。这种模型能够更好地捕捉多种数据之间的关系，并且有

灰太狼/ 2024年03月25日 23:19/ 0 赞/ 43 阅读

相关多模态大模型

多模态大模型是指一种能够处理多种媒体数据（如文本、图像、音频、视频等）的深度学习模型。这些模型可以从不同的数据模态中学习到它们的共同语义，从而实现不同模态之间的跨媒体理解和生成

末蓝、/ 2024年02月05日 23:06/ 0 赞/ 21 阅读

相关多模态大模型技术演进及研究框架

一、多模态预训练概述多模态表示包含两个或两个以上事物表现形式模态是事物的一种表现形式，多模态通常包含两个或者两个以上的模态形式，是从多个视角出发对事物进行描述。生活

青旅半醒/ 2023年09月25日 18:26/ 0 赞/ 29 阅读

相关 AI-多模态-2021：ALIGN【】

[https://arxiv.org/abs/2102.05918][https_arxiv.org_abs_2102.05918] 【写在前面】学习良好的视觉和视觉

傷城~/ 2023年09月25日 14:06/ 0 赞/ 75 阅读

相关 AI-多模态-2022：BLIP【统一理解和生成的多模态】

论文：[https://arxiv.org/abs/2201.12086][https_arxiv.org_abs_2201.12086] 代码：[GitHub - sale

谁借莪１个温暖的怀抱￠/ 2023年09月25日 14:05/ 0 赞/ 33 阅读

相关多模态：CLIP 模型【连接语言与视觉】

CLIP(Contrastive Language-Image Pre-Training，以下简称 CLIP) 模型是 OpenAI 在 2021 年初发布的用于匹配图像和文本

旧城等待，/ 2023年09月25日 14:02/ 0 赞/ 103 阅读

相关 AI-多模态-文本-＞图像-2021：DALL-E模型【OpenAI】

Dall-e：从拟物文字到图片的创造人类不断地从五种感官接收和整合信息，通过视觉、听觉、触觉、嗅觉和味觉等生物信息来理解文字和图片。然而文字和图片属于符号，Dall-e

小灰灰/ 2023年09月25日 13:43/ 0 赞/ 99 阅读

相关（四）：M6:中文多模态预训练模型

文献阅读（四）：M6: A Chinese Multimodal Pretrainer ABSTRACT KEYWORDS 1 INTRODUCTION

妖狐艹你老母/ 2022年10月23日 01:59/ 0 赞/ 120 阅读

相关多模态大模型——通用人工智能路径的探索

7月9日，中国科学院自动化研究所所长徐波在2021世界人工智能大会（WAIC2021）上就人工智能的最新进展进行报告，发布了自动化所研发的跨模态通用人工智能平台—“紫东太初”。

野性酷女/ 2022年10月20日 00:58/ 0 赞/ 183 阅读