Computer >> 컴퓨터 >  >> 네트워킹 >> 인터넷

텍스트에서 표절을 확인하는 방법

텍스트에서 표절을 확인하는 방법

표절은 교사, 작가, 편집자 및 정기적으로 단어와 아이디어를 다루는 사람들에게 항상 문제였으며 인터넷과 복사-붙여넣기 기능의 출현으로 인해 더욱 악화되었습니다. 표절 검사 소프트웨어가 도움이 될 수 있지만 모든 프로그램에 대규모 데이터베이스나 정확한 알고리즘이 있는 것은 아닙니다. 일부 스케치 체커는 제출된 콘텐츠를 자체 목적으로 사용할 수도 있습니다. 최고의 체커라도 100% 성공률은 아닙니다. 그러나 표절 여부를 확인하는 도구가 어떻게 작동하는지 알면 시간을 들일 가치가 있는 도구를 결정하는 데 도움이 됩니다.

표절 검사기는 어떻게 작동합니까?

텍스트에서 표절을 확인하는 방법

모든 텍스트 일치 소프트웨어에는 고유한 접근 방식이 있습니다. 대부분은 동일한 기본 원칙에 따라 작동합니다. 소스 자료의 데이터베이스에 대해 입력된 콘텐츠를 확인하고 유사점을 찾습니다. 그러나 잠재적으로 표절될 수 있는 방대한 양의 콘텐츠를 고려하면 이것은 사소한 작업이 아닙니다. 간단한 줄 단위 검색은 시간이 오래 걸리고 리소스가 많이 소모됩니다.

그렇기 때문에 텍스트 표절 여부를 확인하는 대부분의 도구는 지문을 사용합니다. 데이터베이스의 모든 텍스트와 검사하는 모든 텍스트에 대해 샘플 세트를 추출하고 모든 입력에 대해 고유한 식별자를 생성하는 해싱 알고리즘을 통해 각 샘플을 실행합니다.

텍스트에서 표절을 확인하는 방법

논문에 데이터베이스의 지문과 동일한 지문이 있는 경우 둘 다 입력이 동일하고 표절일 수 있음을 의미합니다. 이로 인해 불가피하게 정확도가 낮아지지만 우수한 지문 알고리즘은 정확한 일치 항목뿐만 아니라 회전 프로그램과 같이 일부 콘텐츠가 변경된 표절도 감지할 수 있는 방식으로 종이에서 샘플을 추출할 수 있습니다.

프로그램이 지문 일치를 찾으면 표절의 가능성이 있는 사례에 플래그를 지정하고 이를 하루라고 할 수 있습니다. 그러나 고품질 소프트웨어는 종종 직접 문자열 일치를 사용하여 텍스트를 한 줄씩 확인합니다. 이것은 데이터베이스가 축소되면 계산적으로 훨씬 가벼워지는 작업입니다. 이는 초기 지문 적중을 확인하는 데 도움이 되며 궁극적인 결정을 내리는 사람에게 더 많은 데이터를 제공합니다.

훌륭한 표절 검사기에서 찾아야 할 사항

표절 검사기는 다음을 갖추어야 합니다.

  1. 강력한 개인정보 보호정책(예:콘텐츠를 저장/판매하지 않음)
  2. 대용량 데이터베이스
  3. 좋은 알고리즘
텍스트에서 표절을 확인하는 방법

개인정보 보호정책

많은 무료(또는 더 자주는 프리미엄) 표절 검사기가 합법적이며 광고를 통해 또는 프리미엄 버전을 판매하여 돈을 벌고 있습니다. 그러나 덜 세심한 사람들 중 일부는 실제로 귀하가 확인한 글을 자신의 목적을 위해 사용하고 있을 수 있습니다. 연구 웹사이트의 콘텐츠로 사용되거나 "스피너"를 통해 실행되어 문구를 변경하고 트래픽을 생성하는 기사로 게시될 수 있습니다. 개인 정보 보호 정책을 확인하고 사이트의 평판을 빠르게 확인하는 것이 좋습니다. 특히 너무 간략하거나 너무 좋아서 사실에 맞지 않는 것 같으면 이 작업을 수행하십시오.

데이터베이스

표절 검사기가 올바른 소스 자료에 액세스할 수 없는 경우 해당 자료가 표절되었는지 알 수 없습니다. 이것은 일반적으로 품질이 낮은 표절 검사기와 고급 표절 검사기를 구분하는 가장 큰 문제입니다. 다른 사람이 소유한 책, 기사 및 기타 콘텐츠 모음에 액세스하는 것은 무료이거나 쉬운 일이 아니므로 많은 도구는 인터넷만 확인할 수 있습니다. 하지만 여기에서 많은 표절이 발생하므로 누군가가 조금 더 노력했을 수도 있는 표절을 확인하려면 책, 저널 기사 또는 기타 개인 자료에 액세스하는 것이 가장 중요합니다.

알고리즘

대부분의 표절 검사기는 알고리즘을 명시적으로 공개하지 않지만 결과의 품질과 정확성은 알고리즘이 얼마나 잘 구축되었는지에 대한 좋은 지표입니다. 이것은 직접 측정하기 어려울 수 있지만 반환되는 세부 정보를 보고 사용자 리뷰를 읽고 다른 소스에서 복사한 자료를 감지할 수 있는지 테스트하면 사이트 검색이 얼마나 포괄적인지 알 수 있습니다. 예를 들어 무료 버전이 Wikipedia 기사에서 복사하여 붙여넣기를 선택하지 못한다면 유료 버전이 매우 철저할 것이라고 기대할 수 없습니다.

최고의 표절 검사기

전문가 수준의 표절 검사기는 대부분 대가가 따르며 사용 가능한 대부분의 무료 옵션은 Google보다 열악하거나 자신의 목적을 위해 귀하의 콘텐츠를 사용할 수 있음을 암시하는 개인정보 보호정책이 있습니다. 무료로 얻을 수 있는 가장 좋은 방법은 몇 가지 평가판 페이지나 표절이 있는지 간단히 알려주는 간단한 보고서입니다. 후자는 더 심층적인 도구를 사용해야 하는지 아니면 수동으로 문서를 검토해야 하는지 여부를 빠르게 평가할 수 있는 방법을 제공하기 때문에 여전히 유용할 수 있습니다.

여러 텍스트(내가 작성한 기사, Wikipedia 항목 및 뉴스 출처)를 사용하여 아래의 각 도구를 테스트했으며 모두 출처와 함께 표절된 콘텐츠를 정확하게 식별할 수 있었습니다. 나는 꽤 많은 완전 무료 사이트를 테스트했지만, 그들 중 많은 곳이 내 기사에서 구절을 식별할 수 없었고 심지어 BBC와 Wikipedia에서 복사 붙여넣기를 찾지 못했습니다. 빠른 Google 검색이 표절된 콘텐츠를 즉시 표시했음에도 불구하고.

1. 구글

표절된 것으로 의심되는 특정 텍스트가 있는 경우 Google은 실제로 가장 먼저 찾는 곳입니다. 한 번에 32단어만 검색할 수 있지만, 일부 단어를 변경했더라도 누군가가 복사한 웹사이트, 종이 또는 책을 검색하기에 충분할 수 있습니다.

2. 문법

텍스트에서 표절을 확인하는 방법

Grammarly는 전체 표절 결과를 얻으려면 편집 서비스에 가입해야 하지만 표절 가능성이 있는지 여부를 알려주는 초기 검사에는 비용이 들지 않습니다. 이는 다른 많은 앱에서 얻을 수 있는 것보다 더 많으며 대부분의 경우 표절로 올바르게 표시되어 좋은 첫 번째 무료 옵션이 되었습니다.

3. SearchEngine 보고서

텍스트에서 표절을 확인하는 방법

기본적으로 Google 래퍼이지만 무료이며 실제로 다른 많은 무료 옵션보다 더 잘 작동합니다. 내가 넣은 것의 대부분이 맞았다. SearchEngineReports를 사용하면 검색당 최대 2,000단어의 텍스트를 확인할 수 있으며(검색 수에 대한 상한선 없음) Google을 통해 한 조각씩 실행하여 어떤 문장이 조회수를 생성하는지 알려줍니다. 또한 향후 탐지를 피하기 위해 표절된 콘텐츠를 다시 작성할 수 있는 옵션도 제공하므로 권장하지 않습니다.

4. 카피 리크

텍스트에서 표절을 확인하는 방법

Copyleaks는 2,500단어 또는 약 10페이지의 무료 검사를 제공합니다. 꽤 널리 사용되며 사용자 친화적 인 인터페이스를 가지고 있으며 확인해야 할 학술 및 과학 작업의 대규모 데이터베이스가 포함되어 있습니다. 인터넷 콘텐츠를 넘어서야 하는 경우 신뢰할 수 있는 시작점입니다. 내가 던진 모든 온라인 콘텐츠가 있습니다.

5. 인용문

텍스트에서 표절을 확인하는 방법

500단어 수표 3개를 무료로 받을 수 있으며 그 후에는 구독해야 합니다. Qutext는 정확성과 철저함으로 좋은 평판을 얻었고, 따라서 내 테스트에서 잘 수행되었습니다. 데이터베이스에는 인터넷 콘텐츠뿐만 아니라 많은 책과 기사가 포함되어 있습니다. 포괄적이면서도 Copyleaks보다 저렴한 것을 찾고 있다면 Quetext가 좋은 출발점입니다.

6. 플라그스캔

텍스트에서 표절을 확인하는 방법

PlagScan은 책, 기사 및 기타 텍스트의 광범위한 데이터베이스를 가지고 있으며 표절된 거의 모든 출처를 식별한 자세한 분석을 반환합니다. 무료 평가판은 2,000단어에 적합하며, 그 후에 계속하려면 크레딧을 구매해야 합니다. 확인할 텍스트가 많지 않은 경우 특정 단어 수를 확인하기 위해 크레딧을 구매하는 시스템이 대부분의 다른 표절 검사기에서 제공하는 구독 옵션보다 저렴할 수 있습니다.

마법탄환은 없다

표절 검사기, 특히 예산 검사기는 거의 확실하게 모든 것을 파악할 수 없습니다. 표절자가 불분명한 출처를 사용하거나 충분히 다시 작성하는 경우, 이를 표시하기 위해 기계가 할 수 있는 일은 많지 않으며 지식이 풍부한 사람도 속일 수 있습니다. 그러나 그들은 훌륭한 첫 번째 방어선이 될 수 있으며 최소한 노력이 덜한 표절을 저지할 수 있습니다.