[CS技巧]网页数据抓取并分析  |
flyby 发表于 2005/7/8 12:39:21 | 项目需求 1、抓取网页数据,分析网页数据中的[下一页]的网址,继续抓取数据,直到把所有需要的网页全部下载完毕; 2、对上一部抓取下来的数据进行分析,保存为需要的Xml格式文件,供相关程序使用。
技术分析 使用C#作为开发工具,用WebRequest、WebResponse获取网页数据,用正则
|
阅读全文(23597) | 回复(12) | 编辑 | 精华 | 删除 |
[xml]Xml文件的格式问题 |
flyby 发表于 2005/7/8 12:33:34 |
近来工作时遇到一个问题。一个在window下编辑的Xml文件,格式为UTF-8。然后通过php程序导入数据库服务器中。php程序使用的也是UTF-8格式,但是却总是出现乱码。
经过研究,发现原来是因为服务器是UNIX操作系统。而一个文件的格式除了编码以外,还有一个不同点:window下的文件是以回车、换行(CRLF)为行尾的;UNIX系统下的文件是以换行(LF)为行尾的。所以需要先将window下的文件,修改成UNIX下需要的格式。
使用微软的Visual Studio.Net可以修改文件的编码格式。方法是用VS打开需要修改格式的xml文件,然后选择[另存为]打开对话框,再选择[编码保存]打开高级保存选项,在[编码]输入框内选择UTF-8(无标签),在[行尾]选择框内选择Unix(LF)。保存即可!
我用它修改了编码及行尾表示后。成功解决问题!
现在有几个问题不明白:
一、UTF8(无标签)和UTF8(带标签)有何区别?
二、怎么使用C#编程了修改一个xml
|
| 阅读全文(4292) | 回复(0) | 编辑 | 精华 | 删除 |
[数据库]MSSQL:如何追加数据到TEXT类型的字段 |
flyby 发表于 2005/7/8 11:50:44 |
对于数据表中Text类型的字段,如何增量修改呢? 我们假定mytab表中有一个text类型的字段:textfldupdate mytab set textfld = textfld + 'newstring' where id=2
这样写的结果是报错:对数据类型而言运算符无效
怎么办呢?我们可以将text类型的数据转换成varchar之后再加新字符串就可以了。正确的语句是:update mytab set textfld = rtrim(convert(varchar,textfld)) + 'newstring' where id=2
值得注意的是,当textfld字段为null值时,null加上任何值的结果总是null。解决的办法是,我们避免textfld字段为null的可能:为该字断设置默认值空字符串'。
|
| 阅读全文(2166) | 回复(-1) | 编辑 | 精华 | 删除 |
[.net]C#:根据年月日获取星期几 |
flyby 发表于 2005/7/8 11:40:27 | 这个函数可以通过年、月、日来获得星期几
/// <summary>根据日期,获得星期几</summary> /// <param name="y">年</param> /// <param name="m">月</param> /// <param name="d">日</param> /// <returns>星期几,1代表星期一;7代表星期日</returns> public static int getWeekDay(int y,int m, int d) { if(m==1) m=13; &nbs
|
| 阅读全文(4979) | 回复(-1) | 编辑 | 精华 | 删除 |
|
|
| « | December 2025 | » | | 日 | 一 | 二 | 三 | 四 | 五 | 六 | | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | | | | |
|
| 公告 |
此Blog中的文章仅代表本人当时观点,不对其正确性做任何担保。转载原创,请知会作者。QQ MSN | |
| Blog信息 |
|
blog名称:倾程记 日志总数:27 评论数量:72 留言数量:-3 访问次数:234675 建立时间:2005年7月8日
| |

|