↖  高中教师养出40亿美元超级独角兽,Stable Diffusion数据集创建者..


-loading- -loading- -loading-

听音频 🔊 . 看视频 🎦

... 2023-04-30 13:50 .. 它只开源了CLIP的代码和模型权重。
    (看来从那时候就已经变得Close了)于是乎,舒曼就开始在Discord网罗了一群同为AI爱好者的朋友,尝试复制OpenAI同等水平的「文本-图像对」数据集。
    没想到这一搞就搞了大半年,直到2021年8月他们首次发布了LAION-400M数据集,里面包含了4.13亿图像-文本对。
    回顾整个创建过程,舒曼对彭博社这样形容:就像是用数百万张抽认卡来教一个人一门外语。
    他们用一个非盈利组织CommonCrawl在2014年到2021年期间,抓取的随机HTML代码来定位网络上的图像,并将这些图像与描述性文本联系起来,最后还得根据一定规则来过滤掉不适合的样本。
    比如,删除了所有文本长度少于五个字符;图像小于5KB的的样本;关键字带有NSFW的……几周之内,他们就拥有了300万对图文对。
    数据集发布之后就收到了各种反响,被用于诸多论文和实验。
    其 .. UfqiNews 16

親切的素颜美女邻家女孩或温柔甜美或性感妩媚

本页Url


👍13 仁智互见 👎0
  • 还没有评论. → +评论
  • -loading- -loading- -loading-


    🤖 智能推荐

    -loading- -loading- -loading-


    回首十年股市路

    简单说下北方工业大学

    证券投资 如何选到好股票

    人类医学史上伟大的发明

     


    +
    AddToFav   
    常在 经典 官宣