需求: 将爬虫获取的HTML页面源码原样保存到mysql数据库中,前段需要调用HTML页面原样展示

问题: HTML代码中有很多反斜杠 \ 符号,导致pymysql或者MySQLdb报错。 不能使用replace将报错字符替换。

解决方法:使用pymysql或者mysqlDb 提供的内置方法scape_string()

 

例如: row_html="\img\test.jpg" 里面包含反斜杠,并且 \t 亦为转义符

转义序列字符
\b退格
\f走纸换页
\n换行
\r回车
\t横向跳格 (Ctrl-I)
\'单引号
\"双引号
\\反斜杠

此时可以使用pymysql或者MySQLdb提供的内置方法解决。

用法:python中有

row_html=pymysql.escape_string(row_html)  

row_html=MySQLdb.escape_string(row_html)

 

PHP中有mysql_real_escape_string

 

java中在上述要求的前提下,哪位大神有好的方法也可以讨论一下

 

Logo

更多推荐