... 2023-04-30 13:50 .. 它只开源了CLIP的代码和模型权重。
(看来从那时候就已经变得Close了)于是乎,舒曼就开始在Discord网罗了一群同为AI爱好者的朋友,尝试复制OpenAI同等水平的「文本-图像对」数据集。
没想到这一搞就搞了大半年,直到2021年8月他们首次发布了LAION-400M数据集,里面包含了4.13亿图像-文本对。
回顾整个创建过程,舒曼对彭博社这样形容:就像是用数百万张抽认卡来教一个人一门外语。
他们用一个非盈利组织CommonCrawl在2014年到2021年期间,抓取的随机HTML代码来定位网络上的图像,并将这些图像与描述性文本联系起来,最后还得根据一定规则来过滤掉不适合的样本。
比如,删除了所有文本长度少于五个字符;图像小于5KB的的样本;关键字带有NSFW的……几周之内,他们就拥有了300万对图文对。
数据集发布之后就收到了各种反响,被用于诸多论文和实验。
其 .. UfqiNews ↓
16
本页Url
🤖 智能推荐