2026/2/16 16:37:16
网站建设
项目流程
惠州电商网站建设,台州做网站公司,做体力活的网站,wordpress设置手机版爬虫任务
有一个爬取小红书上视频内容并且分析的任务#xff0c;下面是一个简单可以运行的demo。
注意加载环境变量#xff0c;这里的.env表示读取相同路径下.env里面的ARK_API_KEY
import os
from volcenginesdkarkruntime import Ark
from dotenv import load_dotenv# 加载…爬虫任务有一个爬取小红书上视频内容并且分析的任务下面是一个简单可以运行的demo。注意加载环境变量这里的.env表示读取相同路径下.env里面的ARK_API_KEYimport os from volcenginesdkarkruntime import Ark from dotenv import load_dotenv # 加载环境变量 env_pathos.path.join(os.path.dirname(__file__),.env)load_dotenv(env_path)# 初始化豆包客户端 clientArk(base_urlhttps://ark.cn-beijing.volces.com/api/v3,api_keyos.getenv(ARK_API_KEY),)# 测试视频URL video_urlhttp://sns-video-hs.xhscdn.com/stream/1/110/259/01e95ce6da070f66010370039b92e65e08_259.mp4responseclient.responses.create(modeldoubao-seed-1-8-251228,input[{role:user,content:[{type:input_video,video_url:video_url,fps:1},{type:input_text,text:请详细描述这个视频的内容。}],}])print(*80)print(响应对象类型:,type(response))print(*80)print(\n响应对象属性:)forattr indir(response):ifnot attr.startswith(_):try:valuegetattr(response,attr)ifnotcallable(value):print(f {attr}: {type(value).__name__} {value})except:passprint(\n*80)print(response.output 结构:)print(*80)ifhasattr(response,output)and response.output:print(foutput 类型: {type(response.output)})print(foutput 长度: {len(response.output)})fori,item inenumerate(response.output):print(f\noutput[{i}] 类型: {type(item)})print(foutput[{i}] 属性:)forattr indir(item):ifnot attr.startswith(_):try:valuegetattr(item,attr)ifnotcallable(value):print(f {attr}: {type(value).__name__} {value})except:passifhasattr(item,content)and item.content:print(f\n content 类型: {type(item.content)})print(f content 长度: {len(item.content)})forj,content_item inenumerate(item.content):print(f\n content[{j}] 类型: {type(content_item)})print(f content[{j}] 属性:)forattr indir(content_item):ifnot attr.startswith(_):try:valuegetattr(content_item,attr)ifnotcallable(value):print(f {attr}: {type(value).__name__} {value})except:passelse:print(response.output 为空或不存在)print(\n*80)print(尝试提取文本:)print(*80)try:ifresponse.output andlen(response.output)0:output_msgresponse.output[0]ifhasattr(output_msg,content)and output_msg.content:forcontent in output_msg.content:ifhasattr(content,text):print(f找到文本: {content.text[:200]}...)breakexcept Exception as e:print(f提取失败: {e})提取的内容为output[1] 类型: class ‘volcenginesdkarkruntime.types.responses.response_output_message.ResponseOutputMessage’output[1] 属性:content: list [ResponseOutputText(type‘output_text’, text‘这个视频是小红书平台的趣味内容围绕“图书馆的桌子怎么搬进来”展开内容分段如下\n\n0-4秒画面呈现图书馆学习区域前景是摆满学习用品的桌面——写有笔记的本子、黄色边框平板、咖啡杯、卡通图案笔筒、白色鼠标等背景有一位女生在整理物品配文和顶部标题接连抛出疑问“你们说图书馆这么多张桌子”“真的是一张一张搬进来的吗”“图书馆这么多桌子咋搬进来的”。\n\n5-6秒切换到评论区展示第一条网友评论“不学你就回宿舍”发布地为山东获2091个赞可展开81条回复下方同步配有对应字幕。\n\n7-9秒展示第二条评论“不想学把手机电脑平板充满电就回宿舍吧”附带彩虹表情发布地为上海获5.4万赞可展开625条回复中间插入吐舌头的猫猫表情包配文字“嘿嘿嘿”呼应评论的调侃语气。\n\n10-13秒展示第三条评论“宿舍门这么小 床又是怎么搬进来的”搭配带问号的白色小人表情包发布地为广东获2164个赞下方还有一条搞笑回复“床小时候搬进来的”延续趣味调侃的风格。\n\n14-17秒展示第四条评论“搬一个然后啃臭加v啃臭加c复制粘贴”是电脑快捷键“CtrlC、CtrlV”的谐音梗发布地为湖北获2442个赞可展开46条回复最后画面是两个紧挨的仓鼠脸表情包右上角配有红色问号图案为视频收尾强化搞笑氛围。\n\n整个视频通过“提出疑问展示神评论”的形式借网友的幽默回复制造笑点风格轻松有趣。’, annotationsNone)]id: str msg_02176839283688100000000000000000000ffffac1531daa551d8model_computed_fields: dict {}model_config: dict {‘extra’: ‘allow’, ‘defer_build’: True, ‘protected_namespaces’: ()}model_extra: dict {}后记2026年1月14日于上海周三。