博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
正则表达式
阅读量:6948 次
发布时间:2019-06-27

本文共 1050 字,大约阅读时间需要 3 分钟。

Set("http://www.testmart.cn/search.aspx?bt=2047&kwdisplay=&kw=&st=0",out index_url);

ReadHtml(index_url,3,30000,"gb2312",false,"",out index_html,out state,obj cookies);

if(state=="OK");
writeline("读取成功");
Set("<td class='tal'><a title='(?<P_name>[^>]*?)' href='(?<P_url>[^>]*?)' target='_blank'>[^>]*?</a></td>",out porduct_ext);
analyzetext(porduct_ext,index_html);
writeline(P_name+""+P_url);
ReadHtml(P_url,3,30000,"gb2312",false,"",out p1_html,out state,obj cookies);
writeline(p1_html);
Set("<div class=\"prodinfo_img_2\">\\s*<a href=\"[^>]*?\" target=\"_blank\" class=\"prodimgA\"><img alt=\"[^>]*?\" src=\"(?<img>[^>]*?)\" /></a>[\\S|\\s]*?<dd>型 号:</dd><dt>(?<Model>[\\S|\\s]*?)</dt>[\\S|\\s]*?<h3 class=\"cprodtitle2\">产品介绍</h3>\\s*<div class=\"cprodcont2\" >\\s*(?<productinfo>[\\S|\\s]*?)\\s*<!--div>#<-->\\s*</div>",out productinfo_ext);
analyzetext(productinfo_ext,p1_html);
writeline(img);
writeline(productinfo);
endanalyzetext();
endanalyzetext();
endif();

//writeline(index_html);

转载于:https://www.cnblogs.com/xanthechum/p/4624977.html

你可能感兴趣的文章
困惑好久 删除配置文件中的一行 怎么办?
查看>>
winform文本框怎么实现html的placeholder效果
查看>>
认识CSS样式
查看>>
excel表格数据信息传递老出错,还有没有更好用数据处理工具?
查看>>
[转]SQLITE3 C语言接口 API 函数简介
查看>>
Delphi XE5中使用jar包
查看>>
org.apache.felix.framework-5.6.12源码解析——org.apache.felix.framework文件夹最后的部分...
查看>>
Python3的tcp socket接收不定长数据包接收到的数据不全。
查看>>
b2b
查看>>
第三周Java学习总结
查看>>
OGRE的安装和编译【转+改】
查看>>
获取管理员组用户
查看>>
Mysql—(2)—
查看>>
简历的分布式
查看>>
[转]string和stringstream用法总结
查看>>
LeetCode:Rotate Array
查看>>
jquery pagination.js 分页
查看>>
DOM对象与jquery对象
查看>>
1.6(SQL学习笔记)存储过程
查看>>
XXS level8
查看>>