精简WordPress eXtended Rss (WXR) 文件格式

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

经过N次Import和数据库清空,终于将之前的WXR文件格式的完备集简化了。


简化原则是适应Sina2WordPress项目的需要,尽可能精简文件大小,删除了导入无效的(如博客标题、博客链接等)和从新浪博客中无法获取的(如评论者的链接和IP等)信息,还有item之前的的作者、分类和标签信息。作者在导入时可以指定的,反而加上会有可能的错误,分类和标签的信息用post中的分类和标签就可以自动统计了。没想明白为什么非要单独列出来,难道是为了空的分类和标签,那还要它干嘛?


一些必不可少的标签及错误总结:

1、wxr_version,缺少会提示“missing/invalid WXR version number”的错误

2、status,否则都会显示成draft

3、post_type,否则无法导入

4、comment_approved,否则无法导入

< ?xml version="1.0" encoding="UTF-8" ?>
 


 

	1.1
	
 
	
		Title test
		
		< ![CDATA[Content_test]]>
		
		2002-12-21 07:59:59
		
		open
		
		publish
		
		post
		
		0
		
 
		< ![CDATA[Tag Test]]>
		< ![CDATA[Category Test]]>
		
		
		
			1
			
			< ![CDATA[anonymous]]>
			
			2012-12-21 07:59:59
			
			< ![CDATA[Content of Comment]]>
			
			1
			
			0
			
		
	


转载于:https://my.oschina.net/ranvane/blog/391068

你可能感兴趣的:(php,python,数据库)