Python教程

【论文泛读179】Small-text:Python 中文本分类的主动学习

本文主要是介绍【论文泛读179】Small-text:Python 中文本分类的主动学习,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

贴一下汇总贴:论文阅读记录

论文链接:《Small-text: Active Learning for Text Classification in Python》

一、摘要

我们提出了 small-text,这是一个简单的模块化主动学习库,它为 Python 中的文本分类提供基于池的主动学习。它带有各种预先实现的最先进的查询策略,包括一些可以利用 GPU 的策略。明确定义的接口允许将多种此类查询策略与不同的分类器相结合,从而促进快速混合和匹配,并使主动学习实验和应用程序的快速开发成为可能。为了以一致的方式访问各种分类器,它集成了几个著名的机器学习库,即 scikit-learn、PyTorch 和 Huggingface 转换器——后者的集成可作为可选的可安装扩展。该库可在此:GitHub。

二、结论

我们引入了small-text,一个模块化的Python库,它为文本分类提供了主动学习。它集成了现有的库,如scikit-learn、PyTorch和transformers,这使得Python生态系统可以轻松访问最先进的主动学习。由于遵循软件工程最佳实践,它提供了一组强大的组件,可以在实验和应用中快速应用主动学习进行文本分类。

三、model

模型框架:
在这里插入图片描述

主动学习旨在最小化所需的标记数据量,同时最大化最终模型的性能,例如文本分类的准确性。

这篇关于【论文泛读179】Small-text:Python 中文本分类的主动学习的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!