模型文本和时刻序列的编码器妥协码器_五月婷婷缴情七月丁香

五月婷婷缴情七月丁香

您的当前位置:五月婷婷缴情七月丁香 > 模型 >

模型文本和时刻序列的编码器妥协码器

时间:2019-02-26 19:51来源:五月婷婷缴情七月丁香

对待Ludwig支持的数据典型(文本、图像、种别等),其供应了一个将原始数据映射到张量的编码器,以及将张量映射到原始数据的解码器。每种数据典型有多个编码器妥协码器。Uber浮现,看待AI开荒者来说,Ludwig能够助助所有人更好地领会深度操练方面的本事,并不妨鼓舞模子疾速迭代。此外,Ludwig还会提供一个纯真的Python编程API,用户能够用它来演练或加载一个模型,并运用它来博得对新数据的预计,在这个例子中,代码如下所示:Uber浮现,改日将为每种数据典范填充几个新的编码器,譬喻用于文本的Transformer,ELMo和BERT,以及用于图像的DenseNet和FractalNet。运用Ludwig演练模型,在模型界说中能够包罗附加音问,比如数据聚合每个特点的预处理数据和模型演练参数, 也不妨保管下来,能够在日后加载,对新数据进行预计。数据集的阵势如下所示:看待AI大多来说,Ludwig能够简化原型设计和数据处分经过,从而让我不妨专注于开荒深度操练模子架构!

  基于这种圆活的编码器-解码器架构,尽管是体味较少的深度操练开荒者,也不妨轻松地为分别的工作演练模型。还将填充其他的数据类型,譬喻音频、点云和图形,同时集成更众可增添的管理安插来管理大数据集,如Petastorm。好比,文本能够用卷积神经密集(CNN),循环神经聚集(RNN)或其全部人编码器编码。今朝,Ludwig有效于二进制值,浮点数,种别,分裂序列,鸠合,袋(bag),图像,文本和时刻序列的编码器妥协码器,而且支柱选定的预演练模子。倘若想扭转演练参数,如周期数、操练率和批尺寸(batch size),能够云云扭转模子部署:在这个例子中, 演练的是一个按照书名、作家、状貌和封面来预计一本书的典型和代价的模子。

  Uber浮现,始末聚集这些特定于数据规范的组件,用户能够将Ludwig用于百般工作。好比,聚合文本编码器和种别解码器,就能够博得一个文天职类器。劈脸模型演练,只必要一个外格数据文献(如CSV)和一个YAML部署文献——用于指定命据文献中哪些列是输入特色,哪些列是输出宗旨变量。尔后,Ludwig会在演练、验证和测验聚合对数据进行随机分割,进行预惩办,并为四个输入树立四个区别的编码器,为两个输出目标树立一个凑合器和两个解码器。张量是线性代数中运用的数据构造。也不妨运用模型去预计新数据的合幕,假使数据聚合有ground truth音讯,还不妨进行比较,合幕如下图所示:默认情形下,文本特性由CNN编码器编码,然而也能够运用RNN编码器,运用情形大小为200的双向LSTM来编码书名。譬喻文天职类、目的分类、图像字幕、序列标签、回归、言语筑模、死板翻译、时刻序列预计和问答等等。内置的齐集器,不妨自愿将统统输入编码器的张量聚集在一路,对它们进行处分,并将其返回给输入解码器。此外,Ludwig还不妨运用开源宣扬式培训框架Horovod,在多个GPU上演练模型,并速速迭代!