RSS 내용중에서 title 내용을 가져오기 위한 간단한 소스 코드입니다.
import sys
import re
import urllib2

def getTitle( url ):
    user_agent = "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729)"
    req = urllib2.Request(url)
    req.add_header("User-agent", user_agent)
    response = urllib2.urlopen(req)
    headers = response.info().headers
    contents = response.readlines()

    output = []
    for line in contents:
        searchRegex = re.search("([^<]+)", line)
        if searchRegex :
            output.append(searchRegex.group(1))

    return output

def main(argv):
    exportFilePath = str(argv[1])
    exportFilePath.strip()
    
    url = "http://npteam.net/rss"
    titles = getTitle( url )
    
    f = file(exportFilePath, 'w')
    for line in titles:
        f.write(line + "\r\n")
    f.close()
    
    
if __name__ == "__main__":
    try:
        main(argv=sys.argv)
    except os.error, err:
        print str(err)
2013/03/20 19:41 2013/03/20 19:41

글 걸기 주소 : 이 글에는 트랙백을 보낼 수 없습니다

덧글을 달아 주세요