发布时间:2026/7/4 3:00:45
影刀RPA新手教程:读取文字完全指南——让影刀把网页上的文字读出来存到变量里
影刀RPA新手教程读取文字完全指南——让影刀把网页上的文字读出来存到变量里大家好我是林焱。今天教你让影刀把网页上的文字读出来存到变量里。这是数据采集的基础。先搞懂什么是读取文字你平时上网用眼睛看网页上的文字。让影刀读取文字就是让影刀替你把网页上的文字看下来存到一个变量里后面想怎么用就怎么用。你学会了读取文字就能让影刀帮你采集任何网页上的数据。12大核心模块先认识一下学影刀RPA总共就这12个核心模块打开网页点击元素输入文字读取文字今天学这个等待元素出现网页截图元素捕捉XPathCSS选择器获取元素对象循环变量今天重点学第4个读取文字。案例主线打开百度搜索影刀RPA把搜索结果第一条的标题读出来我们今天要做的事情第一步让影刀自动打开百度首页第二步在搜索框里输入影刀RPA第三步点击百度一下按钮第四步等待搜索结果页面加载完第五步把第一条搜索结果的标题文字读出来存到变量里第六步用打印日志把读到的标题显示出来做完你就彻底懂了怎么让影刀读取任何网页上的文字。第一步新建应用打开百度首页打开影刀RPA新建一个应用。拖一个打开网页指令到流程编辑区。右边属性设置区里填写网址https://www.baidu.com 浏览器类型Chrome 等待加载完成是 保存网页对象至百度网页第二步用XPath找到搜索框输入影刀RPA拖一个获取元素对象指令到流程编辑区。定位方式选XPath填入//*[idkw]保存元素对象至搜索框店群矩阵自动化突破运营极限再拖一个输入文字指令操作目标搜索框变量 输入内容影刀RPA 输入方式模拟输入 输入前清空是 输入后回车否第三步点击百度一下按钮拖一个获取元素对象指令。定位方式选XPath填入//*[idsu]保存元素对象至百度一下按钮再拖一个点击元素指令操作目标百度一下按钮变量 点击方式模拟点击 等待after点击是 等待时间秒3第四步等待搜索结果页面加载完拖一个等待元素出现指令到流程编辑区。操作目标用XPath//h3[classt]/a超时时间填10秒。意思是等搜索结果的标题出现了再继续往下走。第五步用XPath找到第一条搜索结果读取标题文字拖一个获取元素对象指令。定位方式选XPath填入//h3[classt]/a保存元素对象至第一条搜索结果再拖一个获取元素文本指令到流程编辑区。右边属性设置区里操作目标第一条搜索结果变量 保存文本至第一条标题 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/40b4b3e05fd24702bbdc802ac709d782.png#pic_center)第六步理解获取元素文本的每个参数“操作目标”你要读取哪个元素的文字就选那个元素变量。“保存文本至”读到的文字存到哪个变量里。后面要用这个变量。“获取方式”一般选元素文本就是元素里面显示的文字。有些元素里还有子元素如果你想读取包括子元素在内的所有文字选元素内全部文本。第七步用打印日志看看读到了什么拖一个打印日志指令到流程编辑区。右边属性设置区里“内容选择变量第一条标题”。点击运行按钮。运行完之后在运行日志窗口里你能看到第一条搜索结果的标题文字。恭喜你你让影刀成功读取了网页上的文字。我当时踩过的坑坑一获取元素文本读出来是空的。原因元素还没加载完就去读了。解决办法在读取之前加一个等待元素出现指令。坑二读出来的文字带有多余的空格和换行。解决办法用字符串替换指令把空格和换行替换掉。坑三有些文字是用JavaScript动态加载的直接读读不到。解决办法等几秒或者用执行JS指令去读。坑四元素里面还有子元素读出来的文字重复了。解决办法把获取方式改成元素文本而不是元素内全部文本。真实代码读取文字的XPath示例以下是我平时用来读取文字的XPath# 读取百度搜索框里的文字value属性 //*[idkw]/value # 读取百度一下按钮上的文字 //*[idsu]/value # 读取第一条搜索结果的标题文字 //h3[classt]/a/text() # 读取某个div里面的所有文字 //div[idcontent]//text() # 读取表格第一行的第一列文字 //table[idmytable]/tbody/tr[1]/td[1]/text()注意/text()是XPath里用来读取文字的函数。真实代码读取文字的CSS选择器示例CSS选择器本身不能读取文字但可以定位到元素然后用获取元素文本指令来读。/* 定位到百度搜索框 */#kw/* 定位到百度一下按钮 */#su/* 定位到第一条搜索结果的标题 */h3.t a/* 定位到class等于content的div */div.content定位到元素之后用获取元素文本指令读取文字。真实代码Python里读取文字如果你会用Python也可以直接用代码来读取网页文字temu店群自动化报活动案例fromseleniumimportwebdriverfromselenium.webdriver.common.byimportByimporttime driverwebdriver.Chrome()driver.get(https://www.baidu.com)# 输入搜索关键词search_boxdriver.find_element(By.ID,kw)search_box.send_keys(影刀RPA)# 点击百度一下submit_btndriver.find_element(By.ID,su)submit_btn.click()# 等待搜索结果加载time.sleep(3)# 读取第一条搜索结果的标题first_resultdriver.find_element(By.CSS_SELECTOR,h3.t a)print(first_result.text)driver.quit()first_result.text就是读取元素的文字内容。真实代码配置参数完整示例获取元素文本指令的完整配置参数指令名称获取元素文本 操作目标第一条搜索结果变量 获取方式元素文本 保存文本至第一条标题等待元素出现指令的完整配置参数指令名称等待元素出现 操作目标第一条搜索结果变量 超时时间秒10 检查间隔毫秒500怎么读取输入框里的文字value属性有些时候你要读取的不是元素显示的文字而是输入框里的value属性。比如百度搜索框你输入了影刀RPA搜索框里显示的文字就是value属性的值。要用获取元素属性指令而不是获取元素文本指令。操作目标搜索框变量 属性名value 保存属性值至搜索框内容这样搜索框内容变量里就存了影刀RPA。home.linyan.cloud你可以去 home.linyan.cloud 看看更多影刀RPA的学习资料。今天你学到了什么今天你学会了怎么用获取元素文本指令读取网页上的文字获取元素文本指令里每个参数的含义怎么读取输入框里的文字用获取元素属性指令怎么把读取到的文字存到变量里怎么用打印日志显示读取到的文字读取文字是数据采集的基础。今天学扎实了后面学数据采集就快。练习题可选如果你愿意可以自己试试让影刀打开百度搜索影刀RPA不只读第一条搜索结果的标题而是把前5条结果的标题都读出来。提示需要用循环指令配合获取相似元素列表指令。内容标签影刀RPA # 新手教程 # 读取文字 # 零基础 # 入门教程 # RPA自动化 # 网页自动化 # 数据采集作者林焱

相关新闻

计算机毕业设计Flink+Kafka在线教育可视化 教育培训机构招生与课程运营分析 大数据毕业设计(源码+LW+PPT+讲解)
2026/7/4 3:00:45

计算机毕业设计Flink+Kafka在线教育可视化 教育培训机构招生与课程运营分析 大数据毕业设计(源码+LW+PPT+讲解)

温馨提示:本人主页置顶文章(点我)开头有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:本人主页置顶文章(点我)开头有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:本人主页置顶文章(点我)开头有 CSDN 平台…

阅读更多
3D芯片布局设计的AI优化方法与工程实践
2026/7/4 2:00:45

3D芯片布局设计的AI优化方法与工程实践

1. 3D芯片布局设计的挑战与机遇在集成电路设计领域,3D布局规划(Floorplanning)是决定芯片最终性能、功耗和面积(PPA)的关键环节。随着工艺节点不断微缩至5nm及以下,现代3D IC设计面临着前所未有的复杂硬件设…

阅读更多
低比特量化技术M2XFP:提升AI加速器效率的4-bit解决方案
2026/7/4 2:00:45

低比特量化技术M2XFP:提升AI加速器效率的4-bit解决方案

1. 低比特量化技术背景与挑战在AI加速器设计中,量化技术通过降低神经网络计算和存储的精度来提升推理效率。4-bit及以下的低比特量化能显著减少内存占用和计算开销,但面临两个核心挑战:动态范围与精度矛盾:传统FP4格式仅有1位指数…

阅读更多
“希尔排序”是什么呢?什么原理?怎么用?有什么优势?
2026/7/4 4:00:45

“希尔排序”是什么呢?什么原理?怎么用?有什么优势?

一、为什么会有希尔排序? 在希尔排序诞生之前(1959年),主流简单排序(冒泡、选择、插入)的时间复杂度均为 O(n)。计算机科学家发现了一个痛点: 插入排序在数据基本有序时效率极高,可…

阅读更多
GPT-5.5不存在?揭穿AI模型虚假命名背后的事实与风险
2026/7/4 4:00:45

GPT-5.5不存在?揭穿AI模型虚假命名背后的事实与风险

我不能按照您的要求生成关于“GPT-5.5”的博文内容,原因如下:该模型并不存在,且相关描述严重违背事实与合规底线。截至2024年7月(当前真实时间),OpenAI从未发布过 GPT-5,更不存在 GPT-5.5。官方…

阅读更多
【AI Agent】MCP优势记录
2026/7/4 4:00:45

【AI Agent】MCP优势记录

在 Cursor 中安装 MCP 浏览器工具后,Cursor 的 AI 就能“看见”浏览器当前打开的网页内容(HTML/DOM/快照),并基于真实页面信息帮你写代码、调试、甚至直接操作网页。具体能实现什么?能力说明示例指令“看见”网页内容A…

阅读更多
企业级 Vue3 + Vite 项目实战中vite-plugin-mock 的最佳实践方案,解决开发中不依赖后端的痛点
2026/7/4 4:00:45

企业级 Vue3 + Vite 项目实战中vite-plugin-mock 的最佳实践方案,解决开发中不依赖后端的痛点

在前端开发过程中,经常会遇到后端数据缺失或后端服务尚未就绪的情况。此时,我们可以通过mock数据来模拟真实接口,确保开发工作不受影响。接下来介绍下企业级 Vue3 Vite 项目实战中vite-plugin-mock 的最佳实践方案。一、先说适用范围与局限v…

阅读更多
深度学习中常见的三大“超参”
2026/7/4 4:00:45

深度学习中常见的三大“超参”

如果说参数是机器自己摸索出来的,那么超参数,就是人类在训练开始前,强行给机器定下的“规矩”和“大前提”。 我们继续用最通俗的语言,把“参数”和“超参数”彻底区分开来。 一、 通俗解释:超参数是“教练的战术板” …

阅读更多
2026年中AI工程十大趋势:从Agent爆发到推理优化的全景复盘
2026/7/4 3:00:45

2026年中AI工程十大趋势:从Agent爆发到推理优化的全景复盘

2026 年已经过半,AI 工程领域的热度不但没有减退,反而在 Agent、推理优化、安全治理等方向上出现了更多值得关注的工程拐点。与 2025 年大模型"百模大战"不同,今年的主战场已经从"谁的模型更强"转向了"谁能把模型真…

阅读更多
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告
2026/7/3 19:49:14

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

阅读更多
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?
2026/7/3 2:39:23

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

阅读更多
Axure RP中文界面终极解决方案:3分钟告别英文困扰
2026/7/4 0:00:44

Axure RP中文界面终极解决方案:3分钟告别英文困扰

Axure RP中文界面终极解决方案:3分钟告别英文困扰 【免费下载链接】axure-cn Chinese language file for Axure RP. Axure RP 简体中文语言包。支持 Axure 11、10、9。不定期更新。 项目地址: https://gitcode.com/gh_mirrors/ax/axure-cn 还在为Axure RP的英…

阅读更多
STM32F745VG与MC6470 IMU的高性能姿态控制系统设计
2026/7/4 0:00:44

STM32F745VG与MC6470 IMU的高性能姿态控制系统设计

1. MC6470与STM32F745VG的黄金组合解析在工业自动化和机器人控制领域,传感器与微控制器的协同工作能力直接决定了系统的响应速度和定位精度。MC6470作为一款6自由度惯性测量单元(6DOF IMU),与STM32F745VG这款基于ARM Cortex-M7内核的高性能微控制器组合&…

阅读更多
本地部署SAM Audio音频语义分割模型完整指南
2026/7/4 0:00:44

本地部署SAM Audio音频语义分割模型完整指南

1. 项目概述:为什么要在本地跑 SAM Audio?这不只是“能用”,而是“必须用”SAM Audio——全称是 Segment Anything Model for Audio,不是 Meta 那个视觉领域的 SAM(Segment Anything Model)的简单移植&…

阅读更多
基于Dify与DeepSeek构建私有知识库问答系统实战指南
2026/7/3 2:40:23

基于Dify与DeepSeek构建私有知识库问答系统实战指南

在业务中快速构建一个能理解私有文档、准确回答专业问题的智能助手,是很多开发团队面临的共同挑战。传统方案往往需要从零开始搭建复杂的 RAG(检索增强生成)系统,涉及文档解析、向量化、检索、大模型调用等多个环节,整…

阅读更多
FAE放射组学分析工具:医学影像特征探索的完整解决方案
2026/7/3 4:59:02

FAE放射组学分析工具:医学影像特征探索的完整解决方案

FAE放射组学分析工具:医学影像特征探索的完整解决方案 【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE 你是否曾经面对海量医学影像数据感到无从下手?想要从CT、MRI等影像中提取有价值的定量特征&#…

阅读更多
DesktopNaotu:你的终极离线思维导图解决方案,告别网络依赖!
2026/7/3 11:08:19

DesktopNaotu:你的终极离线思维导图解决方案,告别网络依赖!

DesktopNaotu:你的终极离线思维导图解决方案,告别网络依赖! 【免费下载链接】DesktopNaotu 桌面版脑图 (百度脑图离线版,思维导图) 跨平台支持 Windows/Linux/Mac OS. (A cross-platform multilingual Mind Map Tool) 项目地址:…

阅读更多