设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
报酬
工算小助手
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
约 192GB 短信样本如何标记分类?
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
L 站被爆出有盲水印
›
看了《为什么国漫进步这么明显,有人却还是
›
是我的问题还是女朋友的问题
›
antigravity 中的模型清单列表都是骗人的,
›
昨天在 reddit 上发了个开源插件介绍,被骂
今日热议主题
飞牛 fnOS 发布重要安全更新通知,并提醒用
提供一个自己部署的 DOH
为什么这么多人用飞牛 NAS,有什么优势吗
微信,很快要成为 AI 时代的小丑了
做了一个离职焦虑网站-用来加深你的焦虑
最近老马发钱比较猛,写了个蓝 V 互关程序
在一家公司给国企干外包多年,现在甲方不续
飞牛 NAS 的信任危机, 0Day 漏洞导致用户
飞牛信任崩塌,有什么替代品?
在找在线工具时发现了一个意外好用的网站
显示全部
|
最新评论
25 条回复
·
421 次点击
21#
keakon
小成
2024-9-25 09:58:13
先用 LLM 标注一部分,比如 1 万条,人工校对一下。然后用 bert 类的模型,例如 roberta 加几层预测标签来训练。
这玩意是个体力活,有多少人工,就有多少智能
22#
bbxx11
小成
2024-9-25 10:00:46
zap 短信,不需要联网,有个本地小模型,一直在用 还可以
23#
lisongeee
小成
2024-9-25 10:01:17
不联网下还是有方式从网络传递数据哦
https://github.com/orgs/gkd-kit/discussions/199
24#
xing7673
小成
2024-9-25 11:12:08
@noqwerty 提交反馈在 app store 上直接提交或者调用邮箱或者跳转到 github 提 issue 都可以,直接 app 内置反馈组件我觉得费事费力又不讨好用户
25#
wu67
小成
2024-9-25 11:43:13
大可不必这么麻烦.
正常来说, 短信过滤只需要两道工序, 1 是用关键词黑名单直接 ban, 2 是用关键词白名单把步骤 1 筛出来的恢复正常. 能解决绝大部分辣鸡短信. 搞什么模型、AI 来处理, 有点杀鸡用牛刀的感觉了
26#
naclfish2333
初学
2024-9-25 12:47:17
使用大模型并没有 op 想象的那么久,我之前才用 vllm 部署 glm-4 ,用 3090 一个下午就把整个中文维基的标题分类完了。那个数量差不多也是几百万条。
注意,一定是用 vllm 部署,这个框架的并发能力强的可怕。部署完就 python 写个脚本,并发写到 500 干他就完了。
1
2
3
/ 3 页
浏览过的版块
Google
人工智能
Android
Python
水
React
分享创造
NAS
Netflix
返回顶部