본문 바로가기


gcp jupyter notebook에서 url 사용하여 xml 파일 파싱하기

How to parse xml file in gcp jupyter notebook with url

import xml.etree.ElementTree as ET
import urllib.request

def parsefile(path):
    response = urllib.request.urlopen(path).read()
    tree = ET.fromstring(response)

    time = tree.findall("event")

    starttime = [x.findtext("starttime") for x in time]
    duration = [x.findtext("duration") for x in time]

    if len(startlist) >= 2:
        starttime = int(startlist[0])*60 + int(startlist[1])
        alltime = starttime + int(durationlist[0])*60 + int(durationlist[1])
        return (starttime + alltime) / 2 # 중간으로 잘라줌

<?xml version='1.0' encoding='utf-8'?>
        <database>NIA2019 Database v1</database>

위 코드는 행동의 시간, 지속시간 정보가 있는 xml 파일을 파싱하여

행동의 시작시간+종료시간의 중간을 계산한다.