ai自学 – 芙兰日记

站点概览
功能

冰雪灬独舞

感觉我吃上的时代红利也就只有膨胀神券了

ai自学

2025-8-10 14:39

|

后端

|

989

|

1

323 字

|

2 分钟

本文最后更新于28 天前，其中的信息可能已经过时，如有错误请发送邮件到3368129372@qq.com

本篇文章记录ai自学过程。2025年是agent元年，转行之旅从现在正式开始！！！

1.多模态
https://www.bilibili.com/video/BV1zNt8zzEZX/?spm_id_from=333.1007.tianma.1-3-3.click&vd_source=ce2d296140a2f6de60b84bd36bb33b44
总结：

图片+文字等不同的格式输入就算多模态输入。
文字输入为传统transformer模型，输入的文字分词后转为向量输入给大模型。大模型根据向量一个个输出对应概率的词。
大模型为什么可以按照指定格式输出？因为大模型内部存在一个结构器，不符合结构的词不会出现在候选词语中。
图片与文字的向量计算不在同一向量空间里，因此需要训练，找出足够数量的图片-文本描述对，点积越大越匹配，需要对比学习让正样本对点积增大，负样本对点积减小。简单来说就是把图片先转为一段文字的描述。
2.概念
大模型 = 参数量很大的模型
模型 = 一堆参数组成的函数
大语言模型 = 用于语言处理的大模型。

感谢您的收看祝你天天开心~

评论

发送评论编辑评论

Markdown

悄悄话

邮件提醒

|´・ω・)ノ

ヾ(≧∇≦*)ゝ

(☆ω☆)

（╯‵□′）╯︵┴─┴

￣﹃￣

(/ω＼)

∠( ᐛ 」∠)＿

(๑•̀ㅁ•́ฅ)

→_→

୧(๑•̀⌄•́๑)૭

٩(ˊᗜˋ*)و

(ノ°ο°)ノ

(´இ皿இ｀)

⌇●﹏●⌇

(ฅ´ω`ฅ)

(╯°A°)╯︵○○○

φ(￣∇￣o)

ヾ(´･･｀｡)ノ"

( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃

(ó﹏ò｡)

Σ(っ °Д °;)っ

( ,,´･ω･)ﾉ"(´っω･｀｡)

╮(╯▽╰)╭

o(*////▽////*)q

＞﹏＜

( ๑´•ω•) "(ㆆᴗㆆ)

颜文字

Emoji

小恐龙

花!