Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성
  • C 프로그래밍
  •   
  • C++
  •   
  • Redis
  •   
  • BASH 프로그래밍
  •   
  • Python
  •   
  • Java
  •   
  • 데이터 베이스
  •   
  • HTML
  •   
  • JavaScript
  •   
  • 프로그램 작성
  •   
  • CSS
  •   
  • Ruby
  •   
  • SQL
  •   
  • IOS
  •   
  • Android
  •   
  • MongoDB
  •   
  • MySQL
  •   
  • C#
  •   
  • PHP
  •   
  • SQL Server
  • 프로그램 작성

    1. 소셜 네트워크란 무엇입니까?

      소셜 네트워크는 그래프로 설명되는 이종 및 다중 관계 정보 집합입니다. 그래프는 일반적으로 객체에 해당하는 노드와 객체 간의 관계 또는 연결을 설명하는 연결에 해당하는 모서리로 매우 큽니다. 노드와 연결 모두 속성이 있습니다. 객체는 클래스 레이블을 가질 수 있습니다. 링크는 단방향일 수 있으며 바이너리일 필요는 없습니다. 소셜 네트워크는 그래프로 설명되는 이기종 다중 관계 정보 집합입니다. 그래프는 일반적으로 객체에 해당하는 노드와 객체 간의 관계 또는 연결을 설명하는 연결에 해당하는 모서리로 매우 큽니다. 노드와 연결 모두 속성

    2. 링크 마이닝의 작업은 무엇입니까?

      다음과 같은 링크 마이닝의 몇 가지 작업이 있습니다 - 링크 기반 개체 분류 − 전통적인 분류 접근 방식에서는 객체를 정의하는 속성에 따라 객체를 분류합니다. 링크 기반 분류는 개체의 범주가 속성뿐만 아니라 링크 및 연결된 개체의 속성에 따라 달라지는 것으로 예측합니다. 웹 페이지 분류는 링크 기반 분류의 잘 알려진 사례입니다. 단어 모양(페이지에 나타나는 단어)과 앵커 텍스트(하이퍼링크 단어, 즉 링크를 클릭할 수 있을 때 클릭할 수 있는 단어)를 기반으로 웹 페이지의 분류를 예측합니다. 속성으로. 또한 분류는 페이지 간의

    3. 링크 마이닝의 문제점은 무엇입니까?

      링크 마이닝에는 다음과 같은 몇 가지 문제가 있습니다. - 논리적 종속성 대 통계적 종속성 − 그래프 링크 구조(객체 간의 논리적 관계를 나타냄)와 확률적 종속성(일반적으로 이러한 객체가 논리적으로 관련되어 있는 객체의 속성 간의 상관 관계와 같은 통계적 관계를 나타냄)에는 두 가지 유형의 종속성이 있습니다. 이러한 종속성을 일관되게 처리하는 것은 마이닝할 데이터가 여러 테이블에 존재하는 다중 관계형 데이터 마이닝에서도 어려운 문제입니다. 객체 간의 가능한 여러 논리적 관계를 검색해야 하며, 속성 간의 확률적 종속성에 대한

    4. 다중 관계형 데이터 마이닝이란 무엇입니까?

      다중 관계형 데이터 마이닝(MRDM) 방법은 관계형 데이터베이스의 여러 테이블(관계)을 포함하는 디자인을 검색합니다. 각 테이블 또는 관계는 속성 집합으로 설명되는 엔터티 또는 관계를 나타냅니다. 관계 간의 링크는 관계 간의 관계를 보여줍니다. 데이터가 단일 테이블에 있다고 가정하는 기존 데이터 마이닝 방법을 적용하는 한 가지 방법은 조인 및 집계를 사용하여 다중 관계 데이터를 단일 플랫 데이터 관계로 변환하는 명제화입니다. 이는 거대하고 바람직하지 않은 보편적 관계(모든 속성을 포함)의 생성으로 이어질 수 있습니다. 또한 데이터베

    5. 다중 관계형 클러스터링이란 무엇입니까?

      다중 관계형 클러스터링은 다중 관계의 정보를 활용하여 데이터 개체를 유사성을 기반으로 클러스터 세트로 분할하는 프로세스입니다. 이 섹션에서는 물리적 조인을 피하기 위해 클러스터링 및 튜플 ID 전파에서 사용자 지침을 활용하는 방법을 탐구하는 다중 관계형 클러스터링 알고리즘인 CrossClus(사용자 지침이 있는 교차 관계형 클러스터링)를 소개할 수 있습니다. 다중 관계형 클러스터링의 한 가지 주요 과제는 서로 다른 관계에 너무 많은 속성이 있으며 일반적으로 특정 클러스터링 작업과 관련이 있는 속성의 작은 부분만 있다는 것입니다.

    6. 객체의 상속된 속성을 일반화할 수 있습니까?

      객체 식별자는 다음과 같이 일반화할 수 있습니다. 먼저, 객체 식별자는 객체가 속한 가장 낮은 하위 클래스의 식별자로 일반화됩니다. 그런 다음 이 하위 클래스의 식별자는 클래스/하위 클래스 계층 구조를 위로 올라감으로써 더 높은 수준의 클래스/하위 클래스 식별자로 일반화될 수 있습니다. 유사하게, 클래스 또는 하위 클래스는 연관된 클래스/하위 클래스 계층 구조를 위로 올라가서 해당하는 상위 클래스로 일반화할 수 있습니다. 객체 지향 데이터베이스는 클래스/하위 클래스 계층으로 구성되기 때문에 객체 클래스의 일부 속성이나 메서드는 클

    7. 공간 데이터 마이닝이란 무엇입니까?

      공간 데이터베이스는 지도, 사전 처리된 원격 감지 또는 의료 영상 기록, VLSI 칩 설계 데이터를 포함하여 엄청난 양의 공간 관련 데이터를 저장합니다. 공간 데이터베이스는 관계형 데이터베이스와 구별되는 몇 가지 기능을 가지고 있습니다. 이들은 위상 및/또는 거리 정보를 전달하며, 일반적으로 공간 데이터 액세스 방법에 의해 액세스되는 정교한 다차원 공간 인덱싱 구조로 구성되며 공간 추론, 기하학적 계산 및 공간 지식 표현 기술이 필요한 경우가 많습니다. 공간 데이터 마이닝은 공간 데이터베이스에 명시적으로 저장되지 않은 지식, 공간

    8. 공간 데이터 웨어하우스의 구축 및 활용과 관련된 문제는 무엇입니까?

      공간 데이터 웨어하우스의 구축 및 활용과 관련하여 몇 가지 어려운 문제가 있습니다. 첫 번째 과제는 이기종 소스 및 시스템의 공간 정보를 통합하는 것입니다. 공간 데이터는 일반적으로 다양한 데이터 형식을 사용하여 다양한 산업 회사 및 정부 기관에 저장됩니다. 데이터 형식은 구조별(예:래스터 기반 공간 대 벡터 기반 공간 데이터, 객체 지향 대 관계 모델, 다양한 공간 저장 및 인덱싱 구조)뿐만 아니라 공급업체별( 예:ESRI, MapInfo, Intergraph). 이기종 공간 데이터의 통합 및 교환에 대한 막대한 작업이 있어 공간

    9. 웨이블릿 변환이 클러스터링에 유용한 이유는 무엇입니까?

      WaveCluster는 먼저 데이터 공간에 다차원 그리드 아키텍처를 적용하여 레코드를 요약하는 다중 해상도 클러스터링 알고리즘입니다. 웨이블릿 변환을 사용하여 원래 기능 공간을 변경하고 변환된 공간에서 밀집 영역을 찾을 수 있습니다. 이 방법에서 각 그리드 셀은 셀에 매핑되는 포인트 그룹의 데이터를 요약합니다. 이 요약 데이터는 일반적으로 다중 해상도 웨이블릿 변환 및 후속 클러스터 분석에 사용하기 위해 주 메모리에 맞습니다. 웨이블릿 변환은 신호를 여러 주파수 부대역으로 분해하는 신호 처리 방식입니다. 웨이블릿 모델은 1차원

    10. 기대-극대화란 무엇인가?

      EM(Expectation-Maximization) 알고리즘은 매개변수 추정값을 찾는 데 사용할 수 있는 유명한 반복 정제 알고리즘입니다. 클러스터 평균에 따라 가장 유사한 클러스터에 객체를 생성하는 k-means 패러다임의 확장으로 간주될 수 있습니다. EM은 소속 확률을 정의하는 가중치에 따라 클러스터에 각 객체를 생성합니다. 즉, 클러스터 간에 엄격한 경계가 없습니다. 따라서 새로운 평균은 가중치를 기반으로 평가됩니다. EM은 조합 모델의 매개변수(집합적으로 매개변수 벡터로 정의됨)의 원래 추정치 또는 추측으로 시작합니다.

    11. 개념적 클러스터링이란 무엇입니까?

      개념적 클러스터링은 레이블이 지정되지 않은 객체 세트가 주어지면 객체에 대한 분류 설계를 만드는 기계 학습의 클러스터링 형태입니다. 일반적으로 유사한 객체의 그룹을 식별하는 기존의 클러스터링과 달리 개념적 클러스터링은 각 그룹이 개념 또는 클래스를 정의하는 각 그룹에 대한 특성 정의를 발견함으로써 한 단계 더 나아갑니다. 따라서 개념적 클러스터링은 2단계 프로세스입니다. 클러스터링이 먼저 구현되고 그 다음 특성화가 구현됩니다. 따라서 클러스터링 품질은 단일 개체만을 위한 서비스가 아닙니다. 개념적 클러스터링의 대부분의 기술은 개념

    12. 제약 조건 기반 클러스터 분석의 유형은 무엇입니까?

      제약 기반 클러스터링은 사용자가 명시한 선호도 또는 제약 조건을 충족하는 클러스터를 찾습니다. 제약 조건의 특성을 기반으로 하므로 제약 조건 기반 클러스터링이 다른 접근 방식 대신 채택할 수 있습니다. 다음과 같은 여러 범주의 제약 조건이 있습니다. - 개별 개체에 대한 제약 조건 − 클러스터링할 객체에 대한 제약 조건을 정의할 수 있습니다. 예를 들어 부동산 응용 프로그램에서는 백만 달러 이상의 가치가 있는 고급 맨션만 공간적으로 클러스터링할 수 있습니다. 이 제약 조건은 클러스터링할 개체 컬렉션을 제한합니다. 전처리(예:S

    13. 반 지도 클러스터 분석이란 무엇입니까?

      준지도 클러스터링은 도메인 지식을 사용하여 레이블이 지정되지 않은 데이터를 분할하는 방법입니다. 일반적으로 인스턴스 간의 쌍별 제약 조건 또는 레이블이 지정된 인스턴스의 추가 집합으로 표현됩니다. 감독되지 않은 클러스터링의 품질은 예를 들어 쌍별 제약(예:유사하거나 다른 클러스터에 속하는 것으로 레이블이 지정된 객체 쌍)의 형태로 감독의 일부 약한 구조를 사용하여 본질적으로 향상될 수 있습니다. 사용자 피드백 또는 지침 제약 조건에 의존하는 이러한 클러스터링 절차를 반지도 클러스터링이라고 합니다. 다음과 같은 두 가지 클래스로

    14. 거리 기반 이상값이란 무엇입니까?

      데이터 세트 S의 객체 o는 매개변수 p와 d, 즉 DB(p, d)가 있는 거리 기반(DB) 이상값입니다. 영형. 즉, 통계적 테스트에 의존하는 대신 거리 기반 이상값을 이웃이 충분하지 않은 개체로 생각할 수 있습니다. 이웃은 주어진 객체로부터의 거리를 기반으로 표현됩니다. 통계 기반 방법과 비교하여 거리 기반 이상값 감지는 표준 분포에 대한 불일치 테스트 이면의 아이디어를 일반화하거나 병합합니다. 따라서 거리 기반 이상값은 통합 이상값 또는 UO 이상값이라고도 합니다. 거리 기반 이상값 감지는 관찰된 분포를 일부 표준 분포에 맞

    15. BIRCH란 무엇입니까?

      BIRCH는 계층을 사용하여 균형 잡힌 반복 감소 및 클러스터링을 나타냅니다. 계층적 클러스터링 및 반복적 분할을 포함한 기타 클러스터링 방법을 통합하여 방대한 양의 숫자 레코드를 클러스터링하도록 설계되었습니다. BIRCH는 클러스터링 기능과 클러스터링 기능 트리(CF 트리)의 두 가지 개념을 제공하며, 이는 클러스터 설명을 요약하는 데 사용됩니다. 이러한 구조는 클러스터링 방법을 촉진하여 거대한 데이터베이스에서 최고의 속도와 확장성을 달성하고 들어오는 개체의 증분 및 동적 클러스터링에 효과적입니다. 클러스터에서 n개의 d차원

    16. 회프딩 트리 알고리즘이란 무엇입니까?

      Hoeffding 트리 알고리즘은 스트림 데이터 분류를 위한 의사결정 트리 학습 방법입니다. 처음에는 웹 클릭스트림을 추적하고 사용자가 액세스할 웹 호스트 및 웹 사이트를 예측하는 모델을 구성하는 데 사용되었습니다. 일반적으로 하위 선형 시간으로 실행되며 기존 배치 학습자와 거의 동일한 의사 결정 트리를 생성합니다. 그것은 작은 샘플이 최적의 분할 속성을 선택하기에 충분할 수 있다는 아이디어를 이용하는 Hoeffding 트리를 사용합니다. 이 아이디어는 Hoeffding 경계(또는 Additive Chernoff 경계)에 의해 수

    17. CluStream이란 무엇입니까?

      CluStream은 사용자 지정 온라인 클러스터링 쿼리를 기반으로 진화하는 데이터 스트림의 클러스터링을 위한 알고리즘입니다. 클러스터링 프로세스를 온라인 및 오프라인 구성 요소로 나눕니다. 온라인 구성 요소는 마이크로 클러스터를 사용하여 데이터 스트림에 대한 요약 통계를 계산 및 저장하고 마이크로 클러스터의 증분 온라인 계산 및 유지 관리를 수행합니다. 오프라인 구성 요소는 기울어진 시간 프레임 모델을 기반으로 하는 저장된 요약 통계를 사용하여 매크로 클러스터링을 수행하고 다양한 사용자 질문에 답변합니다. 클러스터는 과거 및 현재

    18. 시계열 데이터베이스란 무엇입니까?

      시계열 데이터베이스에는 반복적인 시간 평가를 통해 액세스되는 일련의 값 또는 이벤트가 포함됩니다. 값은 일반적으로 동일한 시간 간격(예:매시간, 매일, 매주)으로 계산됩니다. 시계열 데이터베이스는 주식 시장 분석, 경제 및 판매 예측, 예산 분석, 유틸리티 연구, 재고 연구, 수확량 예측, 작업 부하 예측, 프로세스 및 품질 관리, 자연 현상 관찰(대기, 온도 포함)과 같은 많은 응용 프로그램에서 널리 사용됩니다. , 바람, 지진), 수치 및 공학 실험, 의료 치료. 시계열 데이터베이스는 시퀀스 데이터베이스이기도 합니다. 시퀀스 데

    19. 불일치 테스트는 어떻게 진행되나요?

      통계적 불일치 테스트 분석 두 가지 가설; 작업 가설과 다른 가설. 작업 가설 H는 n개의 객체로 구성된 전체 데이터 세트가 초기 분포 모델 F, 즉 H:oi에서 나온다는 진술입니다. Δ F, 여기서 i =1, 2, n. 가설을 기각하는 통계적으로 중요한 증거가 없으면 가설이 유지됩니다. 불일치 테스트는 개체가 i 분포와 관련하여 본질적으로 크거나 작습니다. F. 사용 가능한 데이터 지식을 기반으로 불일치 테스트로 사용하기 위해 다양한 테스트 통계가 제안되었습니다. 불일치 테스트를 위해 일부 통계 T가 선택되었고 개체 oi에 대

    20. 계층적 방법이란 무엇입니까?

      계층적 클러스터링 기술은 데이터 개체를 클러스터 트리로 결합하여 작동합니다. 계층적 클러스터링 알고리즘은 하향식 또는 상향식입니다. 진정한 계층적 클러스터링 방법의 품질은 병합 또는 분할 결정이 완료된 후 조정을 구현할 수 없기 때문에 저하됩니다. 클러스터 병합은 클러스터 간의 거리를 기반으로 합니다. 클러스터 사이의 거리에 대해 널리 사용되는 측정값은 다음과 같습니다. 여기서 mi는 클러스터 Ci의 평균, ni는 Ci의 포인트 수, |p – p| 두 점 p와 p 사이의 거리입니다. 계층적 클러스터링 방법 유형 다음과 같은 두 가

    Total 1466 -컴퓨터  FirstPage PreviousPage NextPage LastPage CurrentPage:50/74  20-컴퓨터/Page Goto:1 44 45 46 47 48 49 50 51 52 53 54 55 56