제1절 데이터와 정보
1. 데이터의 정의
데이터는 ‘객관작 사실’ 이라는 존재적 특성을 갖는 동시에 ‘추론/예측/전망/추정’을 위한 근거로 기능하는 당위적 특성 또한 가지고 있음
- 정량적 데이터 : 지역별 온도/풍속/강우량과 같이 수치로 명확하게 표현되는 정량 데이터는 데이터의 양이 크게 증가하더라도 이를 관리하는 시스템(DBMS)에 저장/검색/분석하여 활용하기가 매우 용이함
- 정성적 데이터 : 설문조사의 주관식 응답, 트위터나 페이스북, 블로그 등에 올린 글등과 같은 정성 데이터의 경우 그 형태와 형식이 정해져 있지 않고 천차만별(비정형)이기 때문에 이를 저장/검색/분석하는 데에 상대적으로 많은 비용과 기술적 투가자 수반됨
데이터는 지식경영의 핵심 이슈인 암묵지와 형식지의 상호작용에 있어 중요한 역할을 함
- 암묵지 : ‘김장김치 담그기’, ‘자전거 타기’와 같이 학습과 체험을 통해 개인에게 습득되어 있지만 겉으로 드러나지 않는 지식을 말하는데, 시행착오와 오랜 경험을 통해 개인에게 습득되어 있지만 겉으로 드러나지 않는 지식을 말함. 개인에게 체화되어 있기 때문에 외부에 표출되어 다른 사람에게 공유하기 어렵다는 단점
- 공통화(Socialization), 내면화(Interanlization)
- 형식지 : 교과서, 매뉴얼, 비디오, DB와 같이 형상화된 지식을 의미하는데, 유행의 대상이 있기 때문에 지식의 전달과 공유가 매우 용이, 따라서 형식지의 상호작용에 주목
- 표출화(Extrenalization), 연결화(Combination)
2. 데이터와 정보의 관계
DIKW피라미드(Data, Information, Knowledge, Wisdom hierarchy)
그림[I-1-1] 지식의 피라미드
이와 같이 데이터, 정보, 지식은 상호관계 속에서 역할을 수행하며 인간이 사회활동에서 추구하는 가치창출을 위한 일련의 프로세스로 기능.
제2절 데이터베이스의 정의와 특징
1.용어의 연역
데이터베이스(database)라는 용어가 처음 등장한 것은 1950년대에 미국 정부가 전 세계에 산재한 자국 군대의 군비 상황을 집중 관리하기 위하여 컴퓨터 기술로 구현한 도서관을 설립하면서 비롯됨. 이때, 수집된 자료를 일컫는 ‘데이터(data)의 기지(base)’라는 뜻으로 ‘데이터베이스(database)’가 탄생
2. 데이터베이스의 정의
EU의 ‘데이터베이스의 법적 보호에 관한 지침’에서는 데이터베이스를 “체계적이거나 조직적으로 정리되고 전자식 또는 기타 수단으로 개별적으로 접근할 수 있는 독립된 저작물, 데이터 또는 기타 소재의 수집물”
국내 저작권법에서는 “소재를 체계적으로 배열 또는 구성한 편집물로서 개별적으로 그 소재에 접근하거나 그 소재를 검색할 수 있도록 한 것”
컴퓨터 용어사전 등에서 데이터 베이스는 “동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서 데이터를 받아들이고 저장, 공급하기 위하여 일정한 구조에 따라서 편성된 데이터의 집합”, “관련된 레코드의 집합, 소프트웨어로는 데이터베이스관리시스템(DBMS: Database Amnagement System)을 의미한다”고 정의하고 있음
본가이드에서는 이와 같은 데이터베이스를 “문자, 기호, 음성, 화상, 영상 등 상화 관련된 다수의 콘텐츠를 정보 처리 및 정보통신 기기에 의하여 체계저긍로 수집/축적하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체”로 정의함
3. 데이터베이스의 특징
- 통합된 데이터(intergrated data) : 데이터베이스에는 동일한 내용의 데이터가 중복되어 있지 않다는 것
- 저장된 데이터(stored data) : 자기 디스크나 자기 테이프 드오가 같이 컴퓨터가 접근할 수 있는 저장 매체에 저장되는 것을 의미
- 공용 데이터(shared data) : 여러 사용자가 서로 다른 목적으로 데이터베이스의 데이터를 공동으로 이용한다는 것을 의미
- 변화되는 데이터 : 데이터 베이스가 저장하는 내용은 곧 데이터베이스의 한 상태를 나타냄. 다만 이 상태는 새로운 데이터의 삽입, 기존 데이터의 삭제, 갱신으로 항상 변화하면서도 항상 현재의 정확한 데이터를 유지해야 함
데이터 베이스는 다양한 측면에서 특성을 규정할 수 있음
- 정보의 축적 및 전달 측면 : 대량의 정보를 일정한 형식에 따라 컴퓨터의 정보처리기기가 읽고 쓸 수 있도록 하는 기계 가독성과 다양한 방법으로 필요한 정보를 검색할 수 있는 검색가능성, 그리고 정보통신망을 통하여 원거리에서도 즉시 온라인으로 이용할 수 있는 원격조작성을 갖음
- 정보 이용 측면 : 이용자의 정보 요구에 따라 다양한 정보를 신속하게 획득할 수 있고 원하는 정보를 정확하고 경제적으로 찾아낼 수 있다는 특성
- 정보 관리 측면 : 정보를 일정한 질서와 구조에 따라 정리/저장하고 검색/관리할 수 있도록 하여 방대한 양의 정보를 체계적으로 축적하고 새로운 내용 추가나 갱신이 용이
- 정보기술 발전의 측면 : 데이터베이스는 정보처리, 검색/관리 소프트웨어, 관련 하드웨어, 정보 전송을 위한 네트워크 기술 등의 발전을 견인할 수 있음
- 경제/산업적 측면 : 데아터베이스는 다양한 정보를 필요에 따라 신속하게 제공/이용할 수 있는 인프라소서 특성을 가지고 있어 경제, 산업, 사회 활동의 효율성을 제고하고 국민의 편의를 증진하는 수단으로서의 의미를 갖음
제3절 데이터베이스 활용
1. 기업 내부 데이터베이스
1990년대 중반을 기점으로 이전에는 정보의 ‘수집’과 이를 조직 내에서 공유하기 위한 경영정보스세스템(MIS)과 생산자동화, 통합 자동화 등 기업 활동의 영역별로 구축되던 시스템들이 데이터 마이닝 등의 기술이 등장하면서 단순한 정보의 ‘수집’에서 탈피, ‘분석’이 중심이 되는 시스템 구축으로 변화하게 됨.
전자는 단순 자동화에 치우쳐 있던 OLTP(Online Transaction Processing) 시스템으로 볼 수 있고, 후자는 OLAP(Online Analytical Processing) 시스템으로 볼 수 있음.
2000년대에 들어서면서 기업 DB구축의 화두는 CRM(Cunsumer Relationship Management)와 SCM(Supply Chain Management)로 바뀜.
- CRM : 고겍별 구매이력 데이터베이스를 분석하여 고객에 대한 이해를 돕고 이를 바탕으로 각종 마케팅 전략을 펼치는 것을 말함
- SCM : 기업이 외부 공급업체 또는 제휴업체와 통합된 정보시스템으로 연계하여 시간과 비용을 최적화시키기 위한 것
가. 제조부문
초기에는 기업별 고유 시스템 형태로 구축되다가 이후에는 솔루션 유형으로 발전하게 됨. 특히 제조부문에서는 클라이언트/서버 기반의 내부 정보시스템을 웹환경으로 전환하거나 ERP(Enterprse Resource Planning) 이후에 SCM으로 기능을 확장하는 등 기업내부 인하우스 DB 구축이 이루어졌음. 그러나 이것은 대부분 대기업 중심으로 이루어 졌는데, SCM이 활성화되기 위해서는 결국 중소기업에 대한 투자가 필요하다는 인식이 자리잡게 되었음
따라서 2000년대 중반 이후에는 중소기업에 대한 인하우스 DB 구축 투자 증가가 이루어졌으며, 이의 대표적인 화두가 실시간 기업(RTE)이었음.
- 실시간 기업 : 기업의 비즈니스 프로세스를 투명하고 민첩하게 유지하여 환경 변화에 따른 적응 속도를 최대화하여 지연식나을 업애는 정보화 전략
이를 통해 대기업-중소기업 간의 협업적 IT화의 비중이 확대되고 있음.
나. 금융부분
2000년대 초반에는 EAI(Enterprise Applications Intergration), ERP, e-CRM 등과 같이 데이터베이스 간의 정보 공유 및 통합이나 고객 정보의 전략적 활용이 주된 테마였음. 특히 고객 정보의 전략적 활용은 후단의 인터넷 뱅킹의 경쟁력 강화를 위한 것임.
2000년대 중반에 이르러서는 금융부문에도 DW를 적극적으로 도입하여 관련 DB 마케팅을 증대시키기 위한 노력이 가시화됨. 특히 금융부문은 인터넷뱅킹이 정착되고 방카슈랑스가 도입되면서 차세대 거래정보시스템으로 인한 선도적인 정보화 준거(레퍼런스)로 부상. 대용량 DW를 위한 최적의 BI 기반 시스템 구축도 급속도로 퍼져나감
최근 금융부문은 차세대 프로젝트와 다운사이징, 그리고 바젤2 드으이 대형프로젝트가 마무리되면서 향후에는 EDW(Enterprise Data Warehouse)의 확장이 데이터베이스 시장 확대에 기여할 것으로 예상
다. 유통부문
2000년 이후 유통부문도 전반적인 IT 변화 환경에 맞물려 CRM과 SCM 구축이 이뤄짐. 특정 지역이나 고객 중심으로 운영되어야만 생존할 수 있게 됬으며, 이를 위해 CRM 구축은 필연적인 상황이 됨. SCM의 경우, 전자문서 교환이 본격화되면서 구축이 시작됨. 이외에도 상거래를 위한 각종 인프라 및 KMS(Knowledge Management System)를 위한 별도의 백업시스템도 구축.
2000년대 중반에 체계적인 고객정보의 수집/분석과 상권분석 등으로 심화되었고, 균형성과관리(BSC), 핵심성과지표(KPI), 웹 리포팅 등의 다양한 고객 분석 툴을 통해 기존 데이터베이스와 연계.
- 전자태그(RFID) : 사물과 주변 정보를 접촉 없이도 무선주파수로 전송/처리가 가능한 인식기술로 유비쿼터스의 핵심 기술로 주목받고 있음. 이러한 기술은 유통부문에 적용되었을 때 그 파급효가가 매우 클 것
2. 사회기반구조로서의 데이터베이스
1990년대 이후 정부부처 중심으로 무역, 통관, 물류, 조세, 국세, 조달 등 사회간접자본(SOC) 차원에서 EDI(Electronic Data Interchange, 전자문서교환) 활용이 본격화되면서 부가가치통신만(VAN)을 통한 정보망이 구축되기 시작하였다. 이에 따라 이들 정보망을 통해 유통되거나 이용되는 정복 데이터베이스로 구축되었으며, 이렇게 구축된 데이터베이스는 공공 DB로서 활용될 뿐만 아니라 인프라로서 관련 사업에서 유용하기 활용되기 시작.
1990년대 후반부터는 정보기술이 고도로 발전하면서 데이터베이스 활용이 문서교환 등에 국환되었던 EDI, CALS(Commerce At Light Speed) 등에서 벗어나 국가적으로 필요한 기반 시설이라 할 수 있는 지리, 교통부문의 데이터베이스 구축이 본격적으로 시작됨.
2000년대 들어서면서 지리, 교통부문의 데이터베이스는 고도화되어 현재에 이르렀고, 아울러 의료/교육/행정 등 사회 각 부문으로 공공 DB의 구축/이용이 확대되었음.
가. 물류부분
1995년 국가기간전산망으로 확정되어 출범한 종합물류정보망은 1998년에 이르러 서비스 개발을 완료하여 사용서비스로 제공. 전자지도상에서 운행중인 차량의 위치 및 상태를 실시간으로 파악하여 관제함으로써 운송회사 및 화주 등 서비스 가입자의 합리적인 의사결정을 지원하는 것.
종합물류정보망은 크게 CVO서비스(Commercial Vehicle Operation System, 화물운송정보), EDI서비스, 데이터베이스 서비스(물류정보), 부가서비스로 구성되었음. 여기에서 제공되는 데이터베이스 서비스는 기업의 물류활동 지원과 범국민적 물류인식 확산을 위한 것으로 한국통신(현 KT)에선 이삿짐, 택배 등의 생활 물류정보와 정책, 법령, 물류시설, 장비 등의 깅버 물류정보를 제공.
종합물류정보망에 해양수산부의 항만운영정보시스템(PORT-MIS), 철도청의 철도운영정보시스템(KROIS), 복합화물터미널망, 항공정보망, 민간기업 물류 VAN(Value Added Network)을 연결하고, 무역자동화망과 통관자동화망 등 유선전산망과도 연계하여 물류흐름에 따라 모든 업무를 신속하게 처리하도록 하였음.
나. 지리부분
1995년 시작된 국가지리정보체계(NGIS) 구축은 국가지형도와 공통주제도, 지하매설물도를 전산화하여 기본 공간정보 데이터베이스를 구축하고, 관련 기술 개발과 함께 범국가적인 활용을 위한 국가 표준설정과 활용체계를 개발하는 사업.
2000년대 1단계 사업이 종료되면서 가장 주목할 만한 성과는 국가 수치지형도의 구축임.
- 국가 수치지형도 : 전국을 대상으로 1/1,000(도시지역), 1/5,000(전국), 1/25,000(일부산악지형)의 축적으로 구축된 데이터. 그러나 이때 구축된 데이터는 데이터베이스 형식이 아니라 데이터 포맷인 DXF(Data eXchange Format)로 구축된 것이어서 지형지물의 속성과 위상관계를 표현하지 못하는 한계가 있음.
따라서 2단계로 제2차 국가지리정보체계 기본 계획(2001~2005)을 통해 수치지형도의 수정/갱신, 국가기준점 정비, 지적도면 전산화 등 기본 지리정보 구축과 함께 이를 기반으로 한 토지종합정보망(LMIS) 및 공공제한 관련 정보, 7대 지하시설물 지리정보 등 다양한 활용체계 사업을 추진.
2000년 이후에는 GIS, RS(Remote Sensing), GPS(Global Positioning System), ITS(Inteligent Transport System) 기술을 통합하여 새로운 GIS 응용에 활용하는 4S 통합기술, LBS(Location Based Service) 기술, SIM(Spatial Information Management), 공간 DBMS 등 GIS 관련 정보기술의 비약적인 발전으로 데스크톱 GIS뿐만 아니라 웹 GIS도 실현.
2005년 2단계 국가지리체계 구축 사업이 완료되면서, 건설교통부(현 국토교통부)의 지리정보 유통센터를 중심으로 지방자치단체 등 지리정보 공급기관의 유통용 메타데이터와 지리정보를 저장하는 지리정보통합 관리소를 운영하고 이를 통해 공공기관, 민간 기업, 일반 국민 등 다양한 지리정보 수요자에게 정보를 제공하는 지리정보유통망이 가시화.
다. 교통부분
일반적으로 교통정보는 동적(실시간) 교통정보와 정적(비실시간) 교통정보로 나눌 수 있음. 실시간 교통 정보는 지능형교통시스템(ITS, Inteligent Transport System)이나 방송매체 등에서 교통소통을 목적으로 운전자에게 제공되는 교통정보를 말하며, 비실시간 교통정보는 교통정책 및 계획 수립 등에 필요한 교통분야별 기초자료 및 통계를 제공하는 데이터베이스를 말함.
1998년부터 공공근로 사업으로 전국지역간 교통량 조사 사업으로부터 시작됨. 초기에는 전국의 지역간 여객 및 화물 통행실태 조사를 통해 지역간 통행량을 데이터베이스로 구축. 2000년에는 수도관 정보, 도시 내 육상 교통 조사와 전국 신규도로에 대한 교통시설물 조사가 진행됨. 2001년에는 5개 광역시별 통행량, 대중교통 이용실태, 교통유발원 단위 및 주요구간 교통량 조사로 보다 세분화하여 질 높은 교통 데이터베이스 서비스가 이루어짐. 2002년부터는 공공근로사업이 정보화사업으로 전환되면서 ‘전국 교통 데이터베이스 구축 사업’에서 ‘국가 교통 데이터베이스 구축 사업’으로 변경. 2003년부터 2007년까지는 2단계 국가 교통 데이터베이스 구축 사업을 통해 데이터베이스의 활용성 및 신뢰성 제고에 역점을 두고 있음.
라. 의료부분
1990년대부터 추전된 각종 정보망 구축을 통해 의료정보망이 구축되면서 1996년부터 53개 기관을 대상으로 의료EDI 상용서비스가 제공되기 시작. 2002년 의려법 개정을 통해 전자의무기록이 법적 효력을 갖게 되고, 원격 의료와 전자처방전이 허용되면서 의료정보시스템은 점차 본 궤도에 이름.
일반적으로 병원정보화로 알렺니 의료정보시스템은 크게 처방전달시스템, 임상병리, 전자의무기록, 영상처리시스템(PACS, Picture Archiving and Communicatuons System), 병원의 멀티미디어, 원격의료, 지식정보화로 이루어져 있음. 20005년부터는 국제 의료정보 전송 표준인 HL7의 국내 표준화 작업에 따라 전국적인 진료정보 공유체계 구축 계획이 수립.
2005년 이후에는 유비쿼터스 컴퓨팅 기술의 발달로 의료정보 분야에서도 u헬스(ubuquitous-Health) 시장이 본격적으로 등장. 최근에는 의료서비스에도 고객 중심의 경영이 도입되면서 환자 중심의 병원, ABC, BSC, 6시그마 등의 경영기업이 주요 병원을 필두로 적그적 도입.
마. 교육부분
주로 전국 학생들의 정보 소양 교육을 위주로 했던 1단계 교육정보화종합계획(1997~2000)은 2단계 사업(2001~2005)에서는 주로 첨단 정보통신기술(ICT)을 활용한 각종 교육정보의 개발 및 보급, 정보 활용 교육, 대학정보화 및 교육행정정보화 위주로 사업을 추진.
대학정보화와 관련해서는 대학도서관 소장자료의 데이터베이스 구축이 활발히 추진되어 서지 및 기사 색인을 비롯하여 2003년부터는 원문까지 데이터베이스로 구축. 아울러 2000년대 중반에 접어들면서 모바일 환경이 급속히 확대되면서 일부 대학을 중심으로 모바일 캠퍼스 구축 등 ERP에 대한 투자가 확대. 교육 환경에서도 고객(학생)을 중심으로 한 CRM 등이 본격적으로 도입.
2002년 첫 선을 보인 전국교육정보공유체계는 시/도 교육청과 산하기관, 각급 학교가 보유하고 있는 각종 교육자료를 표준화/체계화하여 시/도 교육청 간 교육정보의 공동활용체제임. 한국교육학술정보원(KERIS)에서 운영 중인 에듀넷(Edunet)과 16개 시/도 교육청 홈페이지 어느 곳에서나 전국의 교육자료를 원스톱으로 검색할 수 있음.
2003년부터 적용되기 시작한 교육행정정보시스템(NEIS, National Education Information System)은 과거 학교별 데이터베이스를 구축해 운영하던 학생/교원 관련 교육정보를 각 시/도 교육청 데이터베이스에 담아 놓음. 인터넷으로 연결해 교무/학사뿐만 아니라 인사, 물품, 회계 등 기타 교육행정 전 업무를 처리하는 시스템.