도서관에서 텍스트 마이닝을 위한 데이터 세트 처리에 관한 내용을 다룬다고 해서 다녀왔다. 수업 내용은 웹 스크래핑하는 법을 아주 기초적인 수준에서 다루었다. HTTrack이라는 프로그램을 소개했다.

10년 전쯤에는 어디에서나 컴퓨팅할 수 있는 것을 목표로 너도나도 유비쿼터스라는 용어를 썼다. 요즘도 IoT(사물 인터넷)나 CPS(사이버 물리 시스템) 같은 연구가 계속되긴 하겠지만, 스마트폰의 대성공으로 불과 10년 전보다 대중의 삶 속에는 이미 어마어마한 수준으로 유비쿼터스 컴퓨팅이 깊이 자리 잡았다.

요즘은 빅데이터 시대다. 검색 이후 제2의 웹 혁명을 일으킨 소셜 네트워크와 현재의 컴퓨팅 환경에서 나오는 엄청난 데이터 홍수 시대에 살고 있다. 모든 학문과 산업에서 데이터와 연관되지 않은 일을 하면 뒤처진 것처럼 보이는 시대이다.

오늘 수업에서 새롭게 배운 내용은 특별히 없지만, 빅데이터가 아름다운 데이터보다 가치 있지 않다(Big data is less valuable than beautiful data)는 말이 기억에 남는다. 수많은 모래알 속에서 진주를 발견하는 일이 중요한 세상이다.

,