【无需打开直接搜索微信;-】 操作使用教程: ...
2025-07-05 0
来源:IT时报
作者/ IT时报记者 潘少颖
编辑/ 潘少颖 孙妍
健身房里、通勤路上、出差途中……在这样的碎片时间,听,是最惬意的一件事,解放双手,解放眼睛,即使是闭目养神的时候,也可以用耳朵打开一片精神天地。
但是,听,不只是音乐、说书这样轻松的内容,如果是一篇分析市场的万字长文、一份晦涩难懂的研究报告、一个专业精深的英文报道,这些没有现成音频的内容可以听吗?而且,这些“生硬”的内容转为声音,是否会机械枯燥?
如何把自己想“听”的任何素材,转换成一个既专业又不会产生“听觉疲劳”的音频?现在有不少可以把素材生成播客的应用。
比如近日豆包PC版全量上线“AI播客”功能,用户只要上传PDF或网页链接,就能一键生成双人对话的播客节目,这一功能基于豆包大模型推出的语音模型,可以模拟真人口语习惯。但目前暂不支持直接输入文本生成播客,豆包App也暂未上线播客功能。
此外,像有道文档FM、ListenHub、扣子空间等也具备根据素材生成播客的功能,这些应用生成的播客能否摆脱“机器味”?
以上播客由ListenHub根据《IT时报》近期报道《售楼处“偷”了我的“脸”》生成
豆包 4000字报道变6分钟音频
一篇新闻,豆包会生成怎么样的播客?
打开豆包PC版,点击“AI播客”,《IT时报》记者上传了一篇本报近期报道《售楼处“偷”了我的“脸”》,几十秒钟,就可以开始听了。但此时还不是完整的音频,豆包采用分段生成的方式,在用户听的同时,后续音频同步生成,缩短等待时间,但听的过程中无法快进或后退。
对于这篇报道,豆包生成的播客标题为《售楼处人脸识别违规成风》,从标题上看,豆包抓准了这篇报道的关键点。
“大家好,今天我们来聊一聊售楼处抓拍人脸识别的问题”,一句开场白就像一档节目的开头,主播和大家打招呼,引出主题。
随后的对话由一男一女根据报道内容展开,这篇报道是基于2025年6月1日《人脸识别技术应用安全管理办法》施行,调查售楼处人脸识别的情况。“在管理办法施行之后,售楼处的人脸识别有没有变化呢?”女主播抛出了这个问题。
“变化并不大。”根据报道内容,男主播得出了这个结论,随后列举报道中的事例,比如北京有人在看房时全副武装地“伪装”自己,把原本的书面语言变得更加口语化,“为了保护自己的隐私,这个看房者把自己捂得严严实实的”。
通过这个案例,两位主播把话题很自然地转到了“现在售楼处收集人脸信息的情况”,引出记者暗访售楼处的内容,比如有的楼盘售楼处大堂区域和沙盘区域装有不少摄像头,基本上能无死角抓拍看房者的人脸等。“更夸张的是,这些人脸信息会被储存1~3个月”,当男主播讲完这句话,女主播马上接一句“真是让人不寒而栗”,就像两个人在聊天。
“现在各地有没有对人脸识别开始罚单”“有啊,当然有”,一问一答,一唱一和,把整篇报道通过对话形式呈现出来,也有自然说话时的语气词,停顿、附和等细节也呈现出来,摆脱了“AI朗读”的影子。
这篇将近4000字的报道最终形成了一段6分钟左右的音频,听完播客如果还不过瘾,可以继续和豆包就相关内容对话,“这篇文章的内容是什么”,“主要围绕售楼处人脸识别技术应用问题展开,揭示了在相关管理办法施行后,强制人脸识别现象仍普遍存在且违规的情况。”
相较于新闻报道,行业分析报告会更显枯燥难懂,有时没有耐心读完一篇很长的报告,那就先让豆包读一下。
《IT时报》记者输入了一篇约1.2万字《2025新能源汽车市场发展趋势与竞争格局研究报告》的网址,完整读完要花一些工夫。“2025年新能源汽车市场会有怎么样的趋势,以及竞争格局会产生怎么样的变化”,很快,主播就把听众引入正题。
报告原文的第一版块是“新能源汽车的发展趋势”,男主播讲述了报告中罗列出的7个趋势,当然不是照读,用口语化的语言呈现,比如“首先从政策上来讲,肯定是越来越大”,契合报告中的“政策支持持续加强”。讲完发展趋势,女主播总结了一句“看来新能源汽车发展既有机遇又有挑战啊”,很自然地过渡到报告第二版块“新能源汽车市场竞争格局”,“想在这个市场站稳脚跟,既要更新技术,还要结合区域政策,也要和合作伙伴保持平衡”,讲完报告中的格局,男主播这样总结。
由于该网站只能免费试读该报告的前6页,两位主播讲完这些免费试读内容后,突然话锋一转,聊起了别的行业,原来他们讲的是网页下方其他领域报告的链接,根据报告标题“做文章”,显得有些不伦不类。
ListenHub 一句话生成完整音频
粘贴链接、上传文件、直接输入文本内容,甚至输入一句话,ListenHub就能快速生成3分钟的短播客,适合碎片时间收听。从内容输入的渠道来看,比豆包更为多元。和豆包一样,ListenHub的播客也由一男一女两位主播负责,一位主要负责提问,替听众问出好奇,另一位则扮演文章作者,分享文章内容。
在ListenHub首页上,有创建、探索等功能,点击“创建”,就能用上述任意一种方式输入内容。《IT时报》记者给ListenHub输入的依然是《售楼处“偷”了我的“脸”》这篇报道的PDF,可以选择“速听精华”和“深度探索”两种模式,“速听精华”的时长为3~5分钟,“深度探索”的时长为6~10分钟,还要选择输出语言,有中文和英文两种。
以“速听精华”为例,生成一段音频需要一两分钟,在生成音频的同时,同步生成大纲和脚本,用户可以边听边看。
根据报道,ListenHub把标题取为《新规后售楼处仍强制“刷脸”:看房者隐私被侵,只为佣金》,抓住了报道中的关键内容。即使选择“速听精华”,ListenHub生成的播客时长还是超过了6分钟,“话说最近人脸识别技术出台了一个新的管理办法,理论上应该更规范,结果你猜怎么着,很多售楼处还是偷偷给人‘刷脸’,这到底是怎么回事”,男主播略带说书式的开场白很能引发听众兴趣。接着,女主播出场了,“这背后,简直就是一出大戏,消费者权益和中介那点小九九,全都搅和在一起了”,从语言风格看,ListenHub比豆包更为有趣。最后,ListenHub呼吁“看房人的这张‘脸’,绝不应该仅仅成为佣金机器上的一个冰冷标签”,呈现的内容很完整。
听完这篇报道,《IT时报》记者依然输入了只能免费试读三分之一的《2025新能源汽车市场发展趋势与竞争格局研究报告》网址,《2025新能源汽车:政策技术双轮驱动,竞争白热化》是播客标题,时长超过5分钟。“聊到新能源汽车,你脑子第一个蹦出来的画面是什么?是满大街跑的电动车还是随处可见的充电桩,是什么让这个市场噌噌地往上涨”,依然用说书式的语言引出主题。如果仅仅看播客脚本,几乎无法和一篇正儿八经的报告联系到一起,因为ListenHub把一篇报告拆解成了口语化的短句与场景化的表达,像朋友之间在聊天一样。
如果是想随便听听,ListenHub更有趣;如果需要明确了解或引用报告中的观点,豆包更合适。
ListenHub生成的这个播客也止于免费试读部分,它及时“刹车”,并没有像豆包一样把网页上的其他内容融入这个播客里。因此,建议如果想要听完整内容,最好输入整篇报告。
除了用新闻和报告作为内容“兜底”,ListenHub也可以根据话题生成播客,只需输入一个话题即可,接下来全靠ListenHub自由发挥。“高考AI填志愿好不好”,收到这个话题,ListenHub开始“研究网站—分析结果—生成报告”三部曲,2分钟后,生成了一个标题为“高考志愿AI:辅助工具,理性为先”的3分钟音频,提出AI通过大数据、算法等就能把千头万绪的院校专业信息整理得清清楚楚,不过AI也有不少“坑”,比如幻觉症、李鬼AI等。如何避免这些坑?优先选用官方AI、多平台交叉验证等。即使没有内容支撑,ListenHub也能生成一个完整的播客。
在ListenHub中,不仅可以制作音频,还可以收听其他用户生成的音频,包括财经、科技、教育等近十个领域,听起来既有料又不累。
排版/ 季嘉颖
图片/ 豆包AI ListenHub
来源/《IT时报》公众号vittimes
相关文章
您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-07-05 0
亲,这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-07-05 0
您好:这款游戏是可以开挂的,软件加微信【添加图中微信】确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人...
2025-07-05 0
发表评论