1、定位:通过在高级选项中循环文本列表模式,可以循环输入文本,实现搜索大量关键词的功能。
2、适用情况:需要在输入框中搜索关键字来收集数据,例如
3、收集器可以自动输入关键字并完成搜索。
(相关资料图)
4、下面的文本循环演示:
5、采集步骤如下:
6、第一步:打开网页拖动一个循环框到规则中修改循环高级选项输入文本。
7、注意:流程图左侧有一排工具栏。如上图所示,工具栏中每个步骤都有简化图标。
8、从上到下依次是:打开网页,点击一个元素,提取数据,输入文本,识别验证码,切换下拉选项,循环,判断条件,鼠标移过元素,结束循环,结束流程。
9、在该示例中,使用了从上到下的第七个循环。鼠标点击图标拖动到流程中,放在打开网页的步骤下。选择循环框,修改高级选项,选择循环模式一栏的文本列表,将关键词粘贴到下面的文本列表中,每个关键词用换行符分开,即回车。
10、输入文本的步骤是点击输入框并选择输入文本。这时候采集器弹出一个界面让你输入文字。如果需要输入单个关键字,则不需要使用循环。在此输入关键字,点击保存,实现输入。在这个例子中,我们需要输入多个关键字。
11、所以你可以不填文本保存,然后把输入文本的步骤拖到之前设置的循环框中,选择用当前循环的文本填充输入框,这样就可以循环输入循环步骤中的文本。
12、第二步:点击搜索步骤提取数据步骤。
13、注:本地采集后,我们可以看到上述网页过程在连续输入我们指定的关键字完成搜索的基础上,成功完成了循环输入,采集的数据是正确的。
14、文字流转可以结合列表模式的收集,搜索收集淘宝、视频网站、房产网站等信息。列表模式的采集可以参考采集单个列表页面的教程。
15、在本文的最后,我们将对循环框中的高级选择进行大致介绍:
16、操作名是周期的名称,可以修改,方便以后修改规则;
17、执行前等待是操作前的等待时间。如果执行前等待时间设置为5秒,则翻页完成后会等待5秒,以回收提取的元素。如果您想在收集每部电影的信息之前等待,您可以在执行提取步骤之前等待。
18、或者将出现元素与执行前等待结合使用,当元素出现时,输入元素的XPath可以结束执行前等待,例如,我们在执行设置循环文本的步骤之前等待10秒,或者将出现的元素设置为电影标题,那么在翻页操作之后,
19、如果标题在第11秒加载,收集器将尝试在第10秒提取循环,而如果标题在第8秒加载,收集器将在结束循环之前等待尝试提取循环。
20、Iframe选项中的元素适用于需要在循环中收集的内容。在网页中是框架,新手教程暂时不涉及。让我们不要按桌子。
21、循环方法包括单元素、固定元素列表、非固定元素列表、URL列表和文本列表。其中,单个元素是指只循环一个元素,一个循环中点击下一页大多使用该操作;固定元素列表表示循环的一些固定部分,
22、不固定元素列表表示循环的一些不固定部分。在这个例子中,如果我们只在一个循环中收集第一个和第二个网页的内容,我们大多使用非固定元素列表,而我们在例子中使用的非固定元素列表是用于输入定位的Xpath。
23、该Xpath定位到的所有元素都会出现在循环列表中;
24、URL列表多用于打开多个网页采集内容的时候,可以放入多个网页链接进行循环打开操作;
25、文本列表则多用于需要输入文字的网页,将列表中多个文本输入网页输入框进行查询。具体示例如本文。
26、满足以下条件时退出循环可以设定循环次数,例如设定循环2次后退出,则循环提取步骤只会采集列表中前两条信息,如果循环翻页中设置循环2次后退出,则会循环采集前两页内容。
本文到此结束,希望对大家有所帮助。