온톨로지 개발 101: 첫 번째 온톨로지 만들기를 위한 가이드

온톨로지 생성에 대한 실용적인 소개인 이 가이드는 도메인 범위 정의, 기존 어휘 재사용, 클래스 계층 구조, 속성 및 인스턴스 구축을 포함한 단계별 방법론을 설명하고, Protégé-2000 내에서의 의미적 관계 및 반복적 개선과 같은 복잡한 설계 문제를 다룹니다.

CartaNova

2025. 7. 7.

https://protege.stanford.edu/publications/ontology_development/ontology101-noy-mcguinness.html

저자: Natalya F. Noy & Deborah L. McGuinness (스탠포드 지식 시스템 연구소)

1. 개념이란 무엇인가?

  • 개념은 특정 분야의 공유된 개념화를 공식적이고 명시적으로 규정한 것입니다.

  • 다음을 정의합니다:

    • 개념 (클래스)

    • 속성 (슬롯)

    • 관계

    • 인스턴스


온톨로지의 목적:
  • 사람과 시스템 간의 공유된 이해를 가능하게 합니다.

  • 도메인 지식을 재사용할 수 있습니다.

  • 운영 지식과 도메인 지식을 분리합니다.

  • 도메인 구조를 분석하고 개선합니다.

2. 왜 온톨로지를 개발하는가?

  • 시스템 간의 상호 운용성을 촉진합니다.

  • 이해 관계자를 위한 공통의 어휘를 제공합니다.

  • 구조화된 데이터 분석시맨틱 검색을 가능하게 합니다.

  • AI 애플리케이션에서 추론자동 추론을 지원합니다.

3. 7단계 온톨로지 개발 과정


단계 1: 도메인과 범위 결정
  • 온톨로지가 무엇을 포함할 것인가?

  • 누가 사용할 것인가?

  • 어떤 질문에 답해야 하는가?

예: 와인 온톨로지는 와인과 음식의 페어링에 초점을 맞출 수 있지만, 와인 재고에는 초점을 맞추지 않을 수 있습니다.


단계 2: 기존 온톨로지 재사용 고려
  • 재사용 가능한 구성 요소를 검색합니다 (예: 더블린 코어, SNOMED, 워드넷).

  • 시간을 절약하고 상호 운용성을 증가시킵니다.


단계 3: 주요 용어 열거
  • 도메인 내의 모든 중요한 용어(명사, 개념, 속성 등)를 나열합니다.

  • 이것이 당신의 온톨로지의 어휘를 형성합니다.


단계 4: 클래스 및 클래스 계층 정의
  • 용어를 세금onomy로 조직합니다( is-a 관계를 사용하여).

  • 접근 방식:

    • 상향식: 일반 개념부터 시작합니다.

    • 하향식: 특정 인스턴스부터 시작합니다.

    • 중간 출발: 중요한 중간 수준의 개념부터 시작합니다.

예:

  • 사물

    • 와인

    • 레드와인

    • 화이트와인


단계 5: 클래스의 속성(슬롯) 정의
  • 클래스의 특성을 설명합니다.

  • 예:

    • 와인색상, , 포도 종류, 제작자를 가집니다.


단계 6: 슬롯의 측면 정의
  • 속성에 대한 제약조건을 규정합니다:

    • 값 유형 (문자열, 숫자 등)

    • 허용 값

    • 기수(예: 1 값, 여러 값)

    • 속성의 도메인 및 범위


단계 7: 인스턴스 만들기
  • 클래스의 특정 예제를 추가합니다.

  • 가능한 경우 실제 데이터를 사용합니다.

예:

  • 인스턴스: ChateauMargaux1995

    • 클래스: 레드와인

    • 색상: 빨강

    • 바디: 풀

4. 설계 원칙 및 모범 사례

  • 완벽함을 목표로 하지 마십시오; 반복하십시오.

  • 올바른 세부 수준은 용도에 따라 다릅니다.

  • 개념을 모듈화 및 재사용 가능하게 유지합니다.

  • 논리적 일관성을 보장하기 위해 필요할 때 분리된 클래스를 사용합니다.

  • 클래스 vs. 인스턴스: 의도와 유연성에 따라 사용합니다.

5. 온톨로지 개발 도구

  • Protégé: 스탠포드에서 제공하는 오픈소스 온톨로지 편집기.

  • Ontolingua, Chimaera, 그리고 OWL 지원 도구들.

  • 많은 도구들이 표준 형식으로 내보내기를 지원합니다(예: RDF, OWL).

6. 피해야 할 일반적인 함정

  • 처음에 너무 많은 세부 사항 모델링.

  • 능력 질문을 정의하지 않음.

  • 기존 온톨로지를 재사용하지 않음.

  • 논리적 일관성을 검증하지 않음.

7. 개발 단계 요약


이 과정은 반복적이며, 선형적이지 않습니다.

8. 결론

  • 온톨로지 구축은 기술적이면서 개념적 설계 과정입니다.

  • 도메인 중심, 목표 지향적, 그리고 협력적이어야 합니다.

  • 잘 구축된 온톨로지는 시맨틱 이해, 자동 추론, 그리고 AI 통합을 지원합니다.

  • 이 과정은 사용, 피드백 및 기술적 필요에 따라 발전합니다.

More Insights

[

ARTICLE

]

AWS를 활용한 데이터 거버넌스 아키텍처 구축

이 다이어그램은 강력한 데이터 거버넌스를 구축하기 위해 설계된 종단 간 아키텍처를 설명하고 있으며, 아마존 웹 서비스(AWS) 도구 모음을 사용합니다. 이 구조는 조직이 안전하고 확장 가능한 환경에서 데이터를 수집, 수집, 저장, 처리, 분석 및 시각화할 수 있도록 합니다. 전체 흐름은 데이터 수명 주기에서 각 주요 기능을 수행하는 여섯 가지 주요 단계로 나뉩니다.

[

ARTICLE

]

AWS를 활용한 데이터 거버넌스 아키텍처 구축

이 다이어그램은 강력한 데이터 거버넌스를 구축하기 위해 설계된 종단 간 아키텍처를 설명하고 있으며, 아마존 웹 서비스(AWS) 도구 모음을 사용합니다. 이 구조는 조직이 안전하고 확장 가능한 환경에서 데이터를 수집, 수집, 저장, 처리, 분석 및 시각화할 수 있도록 합니다. 전체 흐름은 데이터 수명 주기에서 각 주요 기능을 수행하는 여섯 가지 주요 단계로 나뉩니다.

[

ARTICLE

]

AWS를 활용한 데이터 거버넌스 아키텍처 구축

이 다이어그램은 강력한 데이터 거버넌스를 구축하기 위해 설계된 종단 간 아키텍처를 설명하고 있으며, 아마존 웹 서비스(AWS) 도구 모음을 사용합니다. 이 구조는 조직이 안전하고 확장 가능한 환경에서 데이터를 수집, 수집, 저장, 처리, 분석 및 시각화할 수 있도록 합니다. 전체 흐름은 데이터 수명 주기에서 각 주요 기능을 수행하는 여섯 가지 주요 단계로 나뉩니다.

[

PAPER

]

자기 보상 언어 모델

이 논문은 자기 보상 언어 모델(Self-Rewarding Language Models)을 소개합니다. 여기서 대형 언어 모델은 외부 보상 모델에 의존하지 않고 자체 출력을 반복적으로 생성, 평가 및 최적화하여 자기 정렬 및 성능 향상의 새로운 패러다임을 확립합니다.

[

PAPER

]

자기 보상 언어 모델

이 논문은 자기 보상 언어 모델(Self-Rewarding Language Models)을 소개합니다. 여기서 대형 언어 모델은 외부 보상 모델에 의존하지 않고 자체 출력을 반복적으로 생성, 평가 및 최적화하여 자기 정렬 및 성능 향상의 새로운 패러다임을 확립합니다.

[

PAPER

]

자기 보상 언어 모델

이 논문은 자기 보상 언어 모델(Self-Rewarding Language Models)을 소개합니다. 여기서 대형 언어 모델은 외부 보상 모델에 의존하지 않고 자체 출력을 반복적으로 생성, 평가 및 최적화하여 자기 정렬 및 성능 향상의 새로운 패러다임을 확립합니다.

[

PAPER

]

최전선 AI 모델 수 동향: 2028년까지의 예측

2023년과 2028년 사이에 대규모 기초 모델의 극적인 성장을 예측하는 데이터 기반 예측으로, EU AI 법과 같은 새로운 AI 거버넌스 프레임워크 하에서 얼마나 많은 모델이 훈련 컴퓨팅 임계값을 초과할지를 평가합니다.

[

PAPER

]

최전선 AI 모델 수 동향: 2028년까지의 예측

2023년과 2028년 사이에 대규모 기초 모델의 극적인 성장을 예측하는 데이터 기반 예측으로, EU AI 법과 같은 새로운 AI 거버넌스 프레임워크 하에서 얼마나 많은 모델이 훈련 컴퓨팅 임계값을 초과할지를 평가합니다.

[

PAPER

]

최전선 AI 모델 수 동향: 2028년까지의 예측

2023년과 2028년 사이에 대규모 기초 모델의 극적인 성장을 예측하는 데이터 기반 예측으로, EU AI 법과 같은 새로운 AI 거버넌스 프레임워크 하에서 얼마나 많은 모델이 훈련 컴퓨팅 임계값을 초과할지를 평가합니다.

주식회사 카르타노바

Tokyo

도쿄도 미나토구 기타아오야마 2초메 14-4, 더 아가일 아오야마 5층 (107-0061)

Seoul

서울특별시 강남구 테헤란로79길 6, 4층 브이434(삼성동, 제이에스타워) (06158)

© 2025 CartaNova, Inc. All Rights Reserved.

주식회사 카르타노바

Tokyo

도쿄도 미나토구 기타아오야마 2초메 14-4, 더 아가일 아오야마 5층 (107-0061)

Seoul

서울특별시 강남구 테헤란로79길 6, 4층 브이434(삼성동, 제이에스타워) (06158)

© 2025 CartaNova, Inc. All Rights Reserved.

주식회사 카르타노바

Tokyo

도쿄도 미나토구 기타아오야마 2초메 14-4, 더 아가일 아오야마 5층 (107-0061)

Seoul

서울특별시 강남구 테헤란로79길 6, 4층 브이434(삼성동, 제이에스타워) (06158)

© 2025 CartaNova, Inc. All Rights Reserved.