導航:首頁 > 版本升級 > libxml2解析xml文件

libxml2解析xml文件

發布時間:2024-03-24 02:14:34

1. ios怎麼解析xml的demo

ios中如何解析xml文件
兩種方法:1.ios中已有的NSXMLParse類
2.Google的GDataXML也是基於libxml2的,因此在使用GDataXML之前,你需要先導入libxml2。
這里詳解ios中的nsxmlparse:
NSXMLParser 實現的是sax方法解析xml文件。
dom實現的原理是把整個xml文檔一次性讀出,放在一個樹型結構里。在需要的時候,查找特定節點,然後對節點進行讀或寫。他的主要優勢是實現簡單,讀寫平衡;缺點是比較占內存,因為他要把整個xml文檔都讀入內存,文件越大,這種缺點就越明顯。
sax的實現方法和dom不同。他只在xml文檔中查找特定條件的內容,並且只提取需要的內容。這樣做佔用內存小,靈活,正好滿足我們的需求。他的缺點就是寫,有些資料介紹了寫入的方法,但是我感覺這對本例沒有必要。
運行NSXMLParser涉及設置、運行和響應結果。
1)啟動NSXMLParser
要使用NSXMLParser要先創建它,設置各種屬性,主要用到以下幾個方法:
initWithContentsOfURL 通過NSURL創建解析器
initWithData 通過NSData創建解析器
setDelegate 為解析器定義委託
parse 運行解析器
2)充當委託
最重要的5個方法:
//發現元素開始符的處理函數 (即報告元素的開始以及元素的屬性)
- (void)parser:(NSXMLParser *)parser
didStartElement:(NSString *)elementName
namespaceURI:(NSString *)namespaceURI
qualifiedName:(NSString *)qName
attributes:(NSDictionary *)attributeDict

//處理標簽包含內容字元 (報告元素的所有或部分內容)
- (void)parser:(NSXMLParser *)parser foundCharacters:(NSString *)string

//發現元素結束符的處理函數,保存元素各項目數據(即報告元素的結束標記)
- (void)parser:(NSXMLParser *)parser
didEndElement:(NSString *)elementName
namespaceURI:(NSString *)namespaceURI
qualifiedName:(NSString *)qName

//報告解析的結束
- (void)parserDidEndDocument:(NSXMLParser *)parser

//報告不可恢復的解析錯誤
- (void)paser:parserErrorOccured
1.申明了一個xml處理協議,用到NSXMLParser協議,用來具體處理我們要解析的xml文件,把需要的url取出來,存到指定的data里。
*/
//多線程處理類的定義,方法實現,與向主線程回傳data
@class AppRecord;

//@protocol ParseOperationDelegate;
@protocol ParseOperationDelegate
- (void)didFinishParsing:(NSArray *)appList;
- (void)parseErrorOccurred:(NSError *)error;
@end

@interface ParseOperation : NSOperation {
@private
id <</span>ParseOperationDelegate> delegate;//,NSXMLParserDelegate

NSData *dataToParse;

NSMutableArray *workingArray;
AppRecord *workingEntry;
NSMutableString *workingPropertyString;
NSArray *elementsToParse;
BOOL storingCharacterData;
}

- (id)initWithData:(NSData *)data delegate:(id <<span class="s13">ParseOperationDelegate>)theDelegate;

@end
然後完成協議的初始化函數
- (id)initWithData:(NSData *)data delegate:(id <<span class="s13">ParseOperationDelegate>)theDelegate
{
self = [super init];
if (self != nil)
{
self.dataToParse = data;
self.delegate = theDelegate;
self.elementsToParse = [NSArray arrayWithObjects:kIDStr, kNameStr, kImageStr, kArtistStr, nil];
}
return self;
}

2.完成對特定標簽的解析
#pragma mark -
#pragma mark RSS processing

- (void)parser:(NSXMLParser *)parser didStartElement:(NSString *)elementName
namespaceURI:(NSString *)namespaceURI
qualifiedName:(NSString *)qName
attributes:(NSDictionary *)attributeDict
{
// entry: { id (link), im:name (app name), im:image (variable height) }
//
if ([elementName isEqualToString:kEntryStr])
{
self.workingEntry = [[[AppRecord alloc] init] autorelease];
}
storingCharacterData = [elementsToParse containsObject:elementName];
}

3.找到具體的地址與內容,並存儲
- (void)parser:(NSXMLParser *)parser didEndElement:(NSString *)elementName
namespaceURI:(NSString *)namespaceURI
qualifiedName:(NSString *)qName
{
if (self.workingEntry)
{
if (storingCharacterData)
{
NSString *trimmedString = [workingPropertyString :
[NSCharacterSet ]];
[workingPropertyString setString:@""]; // clear the string for next time
if ([elementName isEqualToString:kIDStr])
{
self.workingEntry.appURLString = trimmedString;
}
else if ([elementName isEqualToString:kNameStr])
{
self.workingEntry.appName = trimmedString;
}
else if ([elementName isEqualToString:kImageStr])
{
self.workingEntry.imageURLString = trimmedString;
}
else if ([elementName isEqualToString:kArtistStr])
{
self.workingEntry.artist = trimmedString;
}
}
else if ([elementName isEqualToString:kEntryStr])
{
[self.workingArray addObject:self.workingEntry];
self.workingEntry = nil;
}
}

}

- (void)parser:(NSXMLParser *)parser foundCharacters:(NSString *)string
{
if (storingCharacterData)
{
[workingPropertyString appendString:string];
}
}

第三方解析方法::::::::::::

簡介:採用KissXML第三方程序集來實現,需要引入libxml2.dylib
(另需注意運行時可能會提示「libxml/tree.h找不到「的問題,
解決辦法: 在項目的 TARGETS 中選擇一個目標,在右側切換到 Build Settings 頁,向下找到 Search
Paths 段,其中有一個 Header Search Paths 項,將其值設為:/usr/include/libxml2)如下圖:

ProvinceCity.xml文件格式如下圖:

程序主要代碼如下:

#import"DDXML.h"
#import"DDXMLElementAdditions.h"

@implementation ViewController
//解析XML
staticNSString *kXML =@"//District//Province";
- (void)viewDidLoad
{
[superviewDidLoad];
NSString *path =[[NSStringalloc]initWithString:[[NSBundlemainBundle]pathForResource:@"ProvinceCity"ofType:@"xml"]];

NSData *data = [[NSDataalloc]initWithContentsOfFile:path];
[selfparsedDataFromData:dataandProvince:@"江西省"];
[selfparsedDataFromData:data];
[datarelease];
}
//取特定省份下包含所有城市
-(void)parsedDataFromData:(NSData *)data andProvince:(NSString *)province{
DDXMLDocument *doc = [[DDXMLDocumentalloc]initWithData:dataoptions:0error:nil];

/////解析
NSArray *items = [docnodesForXPath:kXMLerror:nil];

for (DDXMLElement *objin items) {
DDXMLNode *aUser = [obj attributeForName:@"Name"];//取屬性Name的值
if ([aUser.stringValueisEqualToString:province])
{
NSArray *CityLst = [obj elementsForName:@"City"];//取城市點點列表,保存到數組中
if(CityLst.count>0)//第二層
{
for (DDXMLElement *citysin CityLst) {
DDXMLNode *citynode=[citys attributeForName:@"Name"];
NSLog(@"%@",citynode.stringValue);
}
}
}
}
[doc release];
}
//取所有省份及其下級節點,包含修改操作
-(void)parsedDataFromData:(NSData *)data{
DDXMLDocument *doc = [[DDXMLDocumentalloc]initWithData:dataoptions:0error:nil];

/////解析
NSArray *items = [docnodesForXPath:kXMLerror:nil];

for (DDXMLElement *objin items) {
DDXMLNode *aUser = [objattributeForName:@"Name"];//取屬性Name的值
//[aUser setStringValue:@"haha!"];//修改屬性節點的值
[objaddAttribute:[DDXMLNodeattributeWithName:@"test"stringValue:@"wzh"]];//增加一個屬性節點
[objaddAttributeWithName:@"ttt"stringValue:@"343"];//再增加一個屬性節點
//[obj setStringValue:@"NewNode"];//設置當前節點的值
DDXMLNode *newnode=[DDXMLNodeelementWithName:@"newNode"];//設置一個新的節點
[obj addChild:newnode];//給obj添加一個節點

DDXMLElement *newdxml = [[objelementsForName:@"newNode"]objectAtIndex:0];//訪問剛剛添加的節點
[newdxmladdAttributeWithName:@"nodetwo"stringValue:@"twovalue"];//給剛添加的節點增加增的下級節點,並且下級節點再一個屬性值
DDXMLNode *newnode2=[DDXMLNodeelementWithName:@"newNode2"stringValue:@"hello!"];
[newdxmladdChild:newnode2];
}
//保存到沙盒目錄下
NSString *path =[[NSStringalloc]initWithFormat:@"%@/xmlData.xml", [(NSDocumentDirectory,NSUserDomainMask,YES)objectAtIndex:0]];
NSString *result=[[NSStringalloc]initWithFormat:@"%@",doc];

[resultwriteToFile:pathatomically:YESencoding:NSUTF8StringEncoding error:nil];
//[result2 writeToFile:path atomically:YES];//這種方法不行,保存後會有亂碼
[result release];
[path release];
[doc release];
}

2. 如何用python讀取xml文件

一、簡介

XML(eXtensible Markup Language)指可擴展標記語言,被設計用來傳輸和存儲數據,已經日趨成為當前許多新生技術的核心,在不同的領域都有著不同的應用。它是web發展到一定階段的必然產物,既具有SGML的核心特徵,又有著HTML的簡單特性,還具有明確和結構良好等許多新的特性。
python解析XML常見的有三種方法:一是xml.dom.*模塊,它是W3C DOM API的實現,若需要處理DOM API則該模塊很適合,注意xml.dom包裡面有許多模塊,須區分它們間的不同;二是xml.sax.*模塊,它是SAX API的實現,這個模塊犧牲了便捷性來換取速度和內存佔用,SAX是一個基於事件的API,這就意味著它可以「在空中」處理龐大數量的的文檔,不用完全載入進內存;三是xml.etree.ElementTree模塊(簡稱 ET),它提供了輕量級的Python式的API,相對於DOM來說ET 快了很多,而且有很多令人愉悅的API可以使用,相對於SAX來說ET的ET.iterparse也提供了 「在空中」 的處理方式,沒有必要載入整個文檔到內存,ET的性能的平均值和SAX差不多,但是API的效率更高一點而且使用起來很方便。
二、詳解

解析的xml文件(country.xml):
在CODE上查看代碼片派生到我的代碼片

<?xml version="1.0"?>
<data>
<country name="Singapore">
<rank>4</rank>
<year>2011</year>
<gdppc>59900</gdppc>
<neighbor name="Malaysia" direction="N"/>
</country>
<country name="Panama">
<rank>68</rank>
<year>2011</year>
<gdppc>13600</gdppc>
<neighbor name="Costa Rica" direction="W"/>
<neighbor name="Colombia" direction="E"/>
</country>
</data>


1、xml.etree.ElementTree

ElementTree生來就是為了處理XML,它在Python標准庫中有兩種實現:一種是純Python實現的,如xml.etree.ElementTree,另一種是速度快一點的xml.etree.cElementTree。注意:盡量使用C語言實現的那種,因為它速度更快,而且消耗的內存更少。
在CODE上查看代碼片派生到我的代碼片

try:
import xml.etree.cElementTree as ET
except ImportError:
import xml.etree.ElementTree as ET


這是一個讓Python不同的庫使用相同API的一個比較常用的辦法,而從Python 3.3開始ElementTree模塊會自動尋找可用的C庫來加快速度,所以只需要import xml.etree.ElementTree就可以了。
在CODE上查看代碼片派生到我的代碼片

#!/usr/bin/evn python
#coding:utf-8

try:
import xml.etree.cElementTree as ET
except ImportError:
import xml.etree.ElementTree as ET
import sys

try:
tree = ET.parse("country.xml") #打開xml文檔
#root = ET.fromstring(country_string) #從字元串傳遞xml
root = tree.getroot() #獲得root節點
except Exception, e:
print "Error:cannot parse file:country.xml."
sys.exit(1)
print root.tag, "---", root.attrib
for child in root:
print child.tag, "---", child.attrib

print "*"*10
print root[0][1].text #通過下標訪問
print root[0].tag, root[0].text
print "*"*10

for country in root.findall('country'): #找到root節點下的所有country節點
rank = country.find('rank').text #子節點下節點rank的值
name = country.get('name') #子節點下屬性name的值
print name, rank

#修改xml文件
for country in root.findall('country'):
rank = int(country.find('rank').text)
if rank > 50:
root.remove(country)

tree.write('output.xml')


運行結果:

三、總結
(1)Python中XML解析可用的類庫或模塊有xml、libxml2 、lxml 、xpath等,需要深入了解的還需參考相應的文檔。
(2)每一種解析方式都有自己的優點和缺點,選擇前可以綜合各個方面的性能考慮。
(3)若有不足,請留言,在此先感謝!

3. c語言如何解析xml並將所有內容存入數組

/*前段時間恰好做過類似的東西,代碼可以給你參考下。
*Xml配置見最後
*/

typedefstructSrcFileFmt
{
intColID;
charColCode[64];/*欄位英文名稱*/
charColName[128];/*欄位中文名稱*/
charColType[20];/*欄位類型(包含長度)*/
charColComment[128];/*欄位描述*/
}SrcFileFmt;

intmain(intargc,char**argv)
{
SrcFileFmtSrcFileFmt[128];
intiNum=-1;
if(2>argc)
{
printf("Usage:%sSrcXmlFile ",argv[0]);
return-1;
}
iNum=parseSourceCfg(SrcCfgFile,SrcFileFmt);
if(iNum==-1)
{
return-1;
}
return0;
}

/*調用此函數後,xml文件的內容會被存儲到結構體數組SrcFileFmtsrcfilefmt[]中
*此函數依賴於libxml2-2.9.2.tar.xz
*/
intparseSourceCfg(char*FileName,SrcFileFmtsrcfilefmt[])
{/*解析源文件xml,FileName為源xml文件名*/
xmlDocPtrdoc;
xmlNodePtrcur,root;
charsFileName[64]={''};
intcnt=0;
if(FileName==NULL)
{
return-1;
}
sprintf(sFileName,"%s.xml",FileName);
doc=xmlParseFile(sFileName);
if(doc==NULL)
{
return-1;
}
root=xmlDocGetRootElement(doc);
if(root==NULL){
xmlFreeDoc(doc);
return(-1);
}
if(xmlStrcmp(root->name,(constxmlChar*)"SrcRoot"))
{
xmlFreeDoc(doc);
return-1;
}

cur=root->xmlChildrenNode;
while(cur!=NULL)
{
if((!xmlStrcmp(cur->name,(constxmlChar*)"Column")))
{
xmlChar*key;
xmlNodePtrcur_sub=cur;
cur_sub=cur_sub->xmlChildrenNode;

while(cur_sub!=NULL)
{
if((!xmlStrcmp(cur_sub->name,(constxmlChar*)"ColID"))){
key=xmlNodeListGetString(doc,cur_sub->xmlChildrenNode,1);
killblank((char*)key);
srcfilefmt[cnt].ColID=atoi((char*)key);
xmlFree(key);
}
if((!xmlStrcmp(cur_sub->name,(constxmlChar*)"ColCode"))){
key=xmlNodeListGetString(doc,cur_sub->xmlChildrenNode,1);
killblank((char*)key);
strcpy(srcfilefmt[cnt].ColCode,(char*)key);
xmlFree(key);
}
elseif((!xmlStrcmp(cur_sub->name,(constxmlChar*)"ColName"))){
key=xmlNodeListGetString(doc,cur_sub->xmlChildrenNode,1);
killblank((char*)key);
strcpy(srcfilefmt[cnt].ColName,(char*)key);
xmlFree(key);
}
elseif((!xmlStrcmp(cur_sub->name,(constxmlChar*)"ColType"))){
key=xmlNodeListGetString(doc,cur_sub->xmlChildrenNode,1);
killblank((char*)key);
strcpy(srcfilefmt[cnt].ColType,(char*)key);
xmlFree(key);
}
elseif((!xmlStrcmp(cur_sub->name,(constxmlChar*)"ColComment"))){
key=xmlNodeListGetString(doc,cur_sub->xmlChildrenNode,1);
killblank((char*)key);
strcpy(srcfilefmt[cnt].ColComment,(char*)key);
xmlFree(key);
}
cur_sub=cur_sub->next;
}
cnt++;
}
cur=cur->next;
}
xmlFreeDoc(doc);
returncnt;
}

<SrcRoot>
<Column>
<ColID>1</ColID>
<ColCode>kmh</ColCode>
<ColName>欄位1</ColName>
<ColType>VARCHAR(11)</ColType>
</Column>
<Column>
<ColID>2</ColID>
<ColCode>dfkmh</ColCode>
<ColName>欄位2</ColName>
<ColType>VARCHAR(11)</ColType>
</Column>
<Column>
<ColID>3</ColID>
<ColCode>hbh</ColCode>
<ColName>欄位3</ColName>
<ColType>INTEGER(10)</ColType>
</Column>
</SrcRoot>

閱讀全文

與libxml2解析xml文件相關的資料

熱點內容
韓國電影善良的嫂子誰主演的 瀏覽:343
長虹空調遙控什麼app 瀏覽:10
風雲cad文件咋樣打開 瀏覽:312
蘋果微信不鎖屏密碼 瀏覽:995
黃金名字的盜墓電影日本菲律賓 瀏覽:3
先機物聯刷新網路什麼意思 瀏覽:365
電影的過去式怎麼說 瀏覽:45
qq健身名片背景圖片 瀏覽:225
mac電腦如何更改id賬號和密碼錯誤 瀏覽:848
ps矩形工具怎麼自動填色 瀏覽:469
xls格式文件名 瀏覽:484
怎麼查找附近電影院的電影 瀏覽:408
:She Is A Lovely Start. 瀏覽:432
聯想k29開機測試工具 瀏覽:905
win10刪除照片磁貼 瀏覽:659
當樂782舊版本 瀏覽:751
醫院drg可以提取哪些數據 瀏覽:650
一部老虎吃人的電影 瀏覽:137
不用下載可以免費看的 瀏覽:838
凌凌漆電影完整版國語 瀏覽:148

友情鏈接