以下是关于如何用 AI 做内容分类的一些方法和示例:
在生成式 AI 季度数据报告中,内容分类方式经讨论根据 a16z 榜单重新整理,从用户特性出发,将分类改为生产力(文档、ppt、会议、脑爆、数据处理、搜索、浏览、email、文件)、社交(真实、虚拟)、教育(早教、语言学习、公司教育、父母教育、学生工具、学校工具)、创意内容(视频、音乐、声音、个人图像、图像)。同时指出了只能参考热度的赛道,如 LLM 基础设施/开发者生态、垂类分类、Agent 赛道等,以及完全无法 Cover 重要程度的赛道,如 B2B、硬件+AI、游戏+AI 等。
在学习笔记“AI for everyone 吴恩达”中,提到了计算机视觉、自然语言处理和机器人等领域的分类应用。计算机视觉包括图像分类和物体识别、物体检测、图像分割算法、视觉追踪等;自然语言处理涵盖文本分类、信息检索、名称实体识别、机械翻译、解析与语音部分标注技术、语音识别、触发词检测、语音 ID 识别、语音合成技术等;机器人包括机器人“感知”、运动轨迹计划、控制等。
在 OpenAI 官方指南中,对于复杂任务可拆分为更简单的子任务,使用意图分类来识别与用户查询最相关的指令。例如在客户服务应用程序中,将查询分类为计费(取消订阅或升级、添加付款方式、收费说明、对收费提出异议)、技术支持(故障排除、设备兼容性、软件更新)、账户管理(密码重置、更新个人信息、关闭帐户、账户安全)、一般查询(产品信息、定价、反馈、与人交谈)等主要类别和次要类别。
◼ ◼ ◼经讨论,根据a16z榜单重新整理分类,原因是A16Z的报告是发声最频繁,研究广度认可度最高,共识度相对最高,离一线创业者最近的GenAI报告从原有红杉模态分类,即文字,图像,声音模态标准,改为:•生产力(文档+ppt+会议+脑爆+数据处理+搜索+浏览+email+文件)•社交(真实+虚拟)•教育(早教+语言学习+公司教育+父母教育+学生工具+学校工具•创意内容(视频+音乐+声音+个人图像+图像)这样的分类好处是,从用户特性出发,更加具体和聚焦◼只能参考热度的赛道:• LLM基础设施/开发者生态汇聚了巨大融资,包括代码工具等,其C端流量无法完全代表重要程度,仅作参考•垂类分类汇聚了巨大融资,包括金融,医疗等,其2C部分难以管中窥豹,仅做参考• Agent赛道亦是如此◼完全无法Cover重要程度的赛道:• B2B在美国是真正的趋势,本次偏向2C的报告,并无法覆盖•硬件+AI也是非常重要的新兴赛道•游戏+AI也是被寄予厚望的赛道,然后C端流量也无法参考其热度报告说明(3):A16z应用端文章列表,公众号aiwatch.ai扫码访问本表格A16z的报告的确是目前2C端覆盖面最广的本次报告框架也有所参考,推荐阅读。国内比较喜欢的公众号:我自己的:郎瀚威(广告)应用端研究:海外独角兽哥飞白鲸出海Super黄的念想数字生命卡兹克深思senseAl硅兔赛跑特工宇宙宏观:孔某人的低维认知共识粉碎机小熊跑得快
计算机视觉:图像分类和物体识别,是将图片作为输入,输出图像的内容分类。应用于面部识别。物体识别,不仅是分类或者识别物体,还有检测是否有物体出现在一个图像里。图像分割算法,不仅识别出对应的物体的位置,并将不同物体对应的像素点进行标记。识别X光照射图片则使用这种算法。计算机视觉还可以进行视觉追踪,如检测视频中的奔跑者,还可以追踪随时间产生的对应轨迹,确定其运动方向。自然语言处理:文本分类,识别邮箱或文本中的内容,进行归类。可以用于情绪识别信息检索,输入关键字,希望AI可以顺利找出文档。名称实体识别,可以找出句子里的名称。自动提取电话,姓名,国籍等。机械翻译,进行语言翻译解析与语音部分标注技术,将句子词性标注(part-of-speech tagging),最后通过识别名词,形容词,动词等,让AI系统找出哪一些词语可以留意。解析器,将单词组合成短语,最后组合成句子,同样是一种分类标签。语音识别,将麦克风记录的空气高速压力变化数据,转化为文本。触发词检测,识别触发词语音ID识别,倾听说话来识别身份语音合成技术Speech synthesis(text-to-speech,TTS),输入是文本,输出是语音机器人:机器人“感知”,意思是找出围绕于你的东西运动轨迹计划,会寻找机器人行进的路径控制,发送控制指令让机器跟随对应路径
对于需要大量独立指令集来处理不同情况的任务,首先对查询类型进行分类并使用该分类来确定需要哪些指令可能是有益的。这可以通过定义与处理给定类别中的任务相关的固定类别和硬编码指令来实现。这个过程也可以递归地应用于将任务分解为一系列阶段。这种方法的优点是每个查询将仅包含执行任务下一阶段所需的指令,与使用单个查询执行整个任务相比,这可以降低错误率。这也可以降低成本,因为更大的提示运行成本更高([参见定价信息](https://openai.com/pricing))。例如,假设对于客户服务应用程序,可以将查询分类如下:|系统|你将会接收到客户服务查询。将每个查询分类为主要类别和次要类别。以json格式提供你的输出,键(key)为:primary和secondary。主要类别:计费、技术支持、账户管理或一般查询。计费次要类别:-取消订阅或升级-添加付款方式-收费说明-对收费提出异议技术支持次要类别:-故障排除-设备兼容性-软件更新账户管理次要类别:-密码重置-更新个人信息-关闭帐户-账户安全一般查询二级类别:-产品信息-定价-反馈-与人交谈||-|-||用户|我需要让我的互联网重新工作。|