thumbnail thumbnail

2024-03-30 만들고 싶은 제품 주저리 주저리

포스트

회상

 

CS Property 에 재직하던 무렵 곽대표님이 지시 주셨던 업무 내용이 있다. 서울특별시와 성남 신도시를 범위로 하여 30 층 이상의 대형 건물 중 신탁, 공탁 을 제외한 개인 소유로 기명된 건축물을 조사해서 가져오는 업무였다. 기획 자료이자 영업 자료로 사용하기에 자세한 내용을 필요로 하지 않았지만 추려내는 과정에서 2000 건이 넘는 건축물 대장을 일일히 하나하나 뽑아내는 것은 여간 당혹스럽기 그지 없었다.

 

위의 엑셀 자료를 보듯 자가와 임대를 같이 가지는 건축물의 수를 분별하는데에는 여러가지 요인이 있었는데,

  1. 1

    서울에 있는 건축물 일 것.

  1. 2

    30층 이상 높이의 건축물 일 것.

  1. 3

    집합 건물로 분류되거나 회사의 소유가 아닐 것.

  1. 4

    자가 & 임대 건물일 것.

  1. 5

    업무 시설인 건축물 일 것.

등의 여러가지 요인의 조건이 있었다. 이런 건축물의 경우 하나하나 분별하며 건축물 대장을 뽑다 보면 수작업으로 건축 공사 홈페이지의 민원에서 하나하나 입력하여 보아야 한다. 그렇지만 사실 이러한 응답 또한 이미 만들어진 시스템으로 짜여진 출력이며, 마찬가지로 그러한 건축 대장의 자료는 이미 egov (공공 데이터 포털) 사이트에서 이미 배포한 내용이었다.

 

본인은 회사 중 가장 보수적인 건설 업계의 업무 처리 상황이 굉장히 불만족스러웠고 지금은 업계를 떠나 개발자의 길을 걷고 있지만 때때로 생각나는 그 경험이 아쉬움을 불러 일으켰다. 따라서 가장 안타까웠던 경험을 토대로 egov 를 사용한 “건축물 대장 ai 검색기” 를 만들고 싶다는 생각이 들어 이렇게 글을 작성해 본다.

 


기능 구상

 

첫번째로 가능한 llm 을 통해서 만들 수 있는 챗봇의 형태를 띄고 싶다. 이유 : IT 관련 지식이 없는 “과거의 나”와 같은 사람도 이용 할 수 있어야만 의미가 있기 때문이다. 유저의 편의를 고려해 원하는 것을 보다 정확히 뽑아내는 pingpong 방식의 검색기를 원한다. 두번째로는 신뢰도가 높은 국가 기관의 데이터를 사용해야 한다. 이유 : 건설 업계의 고질병인 ‘내가 다시 확인해야 한다.’ 라는 업무 습관은 매우 타당하다고 볼 수 있다. (수 억원의 많은 돈이 나가는 만큼 하나의 실수가 야기하는 리스크를 최소화 하는 것이 부동산 PM 의 최종 목표이기 때문이다.) 때문에 적절히 사용하기 편하고 그들이 신뢰할 수 있는 사이트의 정보를 이용했다는 점을 이용해서 사용 할 수 있도록 만들 필요가 있다. 국토부의 홈페이지나 각 지역의 지자체 홈페이지의 보고서 등을 검색할 수 있어야 하고 건축물 대장의 경우는 공공 데이터 포털 사이트에서 뽑아 올 수 있을 것 이다. 세번째는 건축, 토목에 관련된 내용까지 확장할 수 있어야 한다. 이유 : 두번째 에서도 언급되었지만 지자체의 홈페이지에서 매해 갱신되는 “2026년도 OO 시 개발 계획서” 등의 자료는 건설 업계에서 없어서는 안됄 자료이다. 본인은 이전 회사에서 이러한 자료를 동시에 찾아서 보고를 올리는 근린 지역 조사 리서치 업무를 담당한 바 수시로 바뀌는 공문을 하나하나 다 찾아서 올려드리기에는 무리가 있었다. 결국 건축물 대장을 찾아주는 행위가 목적이면 좋지만 리스트 업 된 건축물 대장을 더욱 용도 있게 사용하게 끔 자료 가공을 통해 생산성 있는 또 다른 자료로 만들기 위함이다. 그러한 자료의 기준은 터부만이나 부동산계 신탁 회사들의 사업성 보고서를 참조하여 제작하게 만들 예정이다.

 


개발 계획

 

spring 표준을 사용한 개발 방식을 채택하여 개발할 것 이며, kotlin 과 python 을 이용할 것이다. egov 프레임 워크, openAi, steamlit 프론트, LangChain 을 이용한 프롬프트 엔지니어링을 진행 할 예정이며 임베딩을 통해 더 더욱 세세한 검색 결과를 가져오기 위해 langchain.agent 를 이용 계획에 있다. (그 외 등등은 잠시 회의 후 다시 작성 예정….)