네이버 불펌 걸러내긴 뭘 걸러내는건가? :: 2007.08.15 14:16

좀전 서명덕님의 네이버, 불펌 중복자료 이렇게 걸러낸다 를 읽고 네이버에서 검색을 한번 해봤습니다.

제 글을 퍼간 블로거 글만 검색되고 제 글은 보이지도 않습니다.

아르님의 댓글이 정답같네요. -.-

아르 07/08/15 12:27 R X
왠지 이렇게 될 것 같아요...

1) A가 글을 작성하면
2) 그걸 네이버 블로거 B가 퍼가고
3) 네이버는 B글을 원저작자로 인식.
4) A 글은 펌글로 판별되서 아웃오브안중
...

검색어 : nLite 통합, VMware 성능, VMware 3D

nLite 로 윈도우 통합 시디 만들기 (http://rinapc.com/72)

VMware System 성능을 향상시키는 10가지 방법 (http://rinapc.com/121)

VMware 가상 컴퓨터에서 3D 게임하기?  (http://rinapc.com/120)

  • Favicon of http://www.rainydoll.com BlogIcon rainydoll | 2007.08.15 15:22 | PERMALINK | EDIT/DEL | REPLY

    불펌 중복자료를 걸러내는게 아니라 네이버것만 선별해서 보여주는군요.

    네이버 알고리즘은 '네이버 블로그면 무조건 원본'이라는 식으로 돌아가는지도... -_-;;

    • Favicon of https://rinapc.com BlogIcon 리나 | 2007.08.15 19:48 신고 | PERMALINK | EDIT/DEL

      중복된 자료 걸러낸 건 어느 정도 만족스럽더군요.
      단 네이버 블로그를 원본으로 보는 것이 문제죠. ^^

  • Favicon of http://blog.orir.net/ BlogIcon pei | 2007.08.15 15:46 | PERMALINK | EDIT/DEL | REPLY

    제목이 상당히 자극적이네요;

    서명덕님이 쓰신 글을 제대로 읽어보긴 하셨나요?

    거기서 중복자료를 걸러내기 위한 시스템이 어떤건지는 읽어보고 오셨나요?

    아니면 그냥 기사 제목만 보고 딴지거시는 건지는 모르겠습니다.

    해당 기사를 보면, 카페-블로그-뉴스 간의 중복컨텐츠를 걸러내기 위한 시스템이라고 소개되고 있습니다.

    님께서 말씀하신 상황과는 무관한 시스템이죠.

    물론 네이버의 검색결과에서 펌글들이 노출되고, 원글보다 상단에 위치되는 것은 문제가 되긴 하지만,

    컴퓨터가 100% 원글과 펌글을 구분해주는을 걸러내줄 수 있는 기계도 아니고,

    인간지능으로 수만명의 인력자원을 이용한다 해도 사실 인터넷이라는 특성상 원글과 펌글을 100% 걸러낼 수는 없습니다.

    그렇다고 네이버가 마냥 방치해두는 것도 아니고, 나름대로 (눈에보이는 결과는 없겠지만) 자체적으로도 문제점을 인식하고 해결하려 노력하고 있겠죠.

    기사조차 제대로 보지않고, '네이버 뭘 한다는건가?' 식으로 아니꼽다는 말은 상당히 불쾌합니다.

    • Favicon of http://www.gaver.org BlogIcon 아르 | 2007.08.15 16:14 | PERMALINK | EDIT/DEL

      그 중복자료를 걸러내기 위한 시스템이 한달전부터 시행되고 있는 상태이며, 그 여파인지, 티스토리를 사용하고 있는 블로거들의 글이 검색결과에서 제외되고 있지요.

      대신 네이버 블로거들이 퍼갔던 글은 그대로 검색결과 상위에 노출되고 있으니 이 기사가 전혀 무관하다곤 볼 수 없다고 생각합니다.

      그리고 카페-블로그-뉴스 간의 한정적인 필터링이라기 보다는 검색결과에 캐치되는 모든 문서컨텐츠를 대상으로 적용되는 시스템이라고 언급이 되어있구요.

      -_-a;... 뭐 제가 잘못 해석했을 수도 있겠습니다만

      그렇다고 '너 글 똑바로 읽어봤냐' 라는 식으로 뭐라고 하시는 건, 실례가 아닐까하는 생각을 해봅니다...;

    • Favicon of https://rinapc.com BlogIcon 리나 | 2007.08.15 19:41 신고 | PERMALINK | EDIT/DEL

      제가 글을 제대로 이해 못 했을 수도 있겠지만...
      뭐가 그렇게 불쾌하죠? 네이버 관계자입니까? ㅡ.ㅡ

  • Favicon of http://www.naver.com/ BlogIcon 너구리 | 2007.08.15 16:48 | PERMALINK | EDIT/DEL | REPLY

    그럼 아에 하질 말던가
    제대로 못할거면 시작을 말아야 되는거 아닙니까?

    되는대로 벌려 놓고 보자는 무책임하고 유치한 행동은 기업이 할짓이 아니죠
    그리고 검색결과라는 정확한 증거로 글을 쓰신분에게 뭐? 불쾌해?

    네이버직원이 아니라면 불쾌하다는 말을 하지 마시죠 -_-;;

    • Favicon of http://www.naver.com/ BlogIcon 너구리 | 2007.08.15 16:49 | PERMALINK | EDIT/DEL

      윗글은 페이님께 드리는 말입니다^^

    • 광복절특사 | 2007.08.15 17:15 | PERMALINK | EDIT/DEL

      pei 이사람은 네이버에 대한 조금의 비판이라도 하면 길길히 날뛰면서 악플 달더군요. 신경쓰지 않으셔도 될듯. 너구리님 말대로 뇌이버 직원인지도 몰라요^^

    • Favicon of https://rinapc.com BlogIcon 리나 | 2007.08.15 19:52 신고 | PERMALINK | EDIT/DEL

      저도 pei 라는 분이 왜 저렇게 흥분하는지 모르겠습니다. ^^

  • Favicon of http://www.yebigun1.mil.kr/homepage/Home.jsp BlogIcon 님아최고에요 | 2007.08.15 17:07 | PERMALINK | EDIT/DEL | REPLY

    댓글들을 보고 있으니 한심하고 불쌍하다고 생각하는 1인...

    네이버는 조금씩 변화고 있는데 메타쪽 일부 극성 찌질이들의 의식수준은 점점 낮아지는듯..

    • 광복절특사 | 2007.08.15 17:39 | PERMALINK | EDIT/DEL

      이런 악플성 댓글을 보고 있으면 한심하고 불쌍하다고 생각하는 1인..

  • Favicon of http://ryan.goinsadong.com BlogIcon 리안 | 2007.08.15 17:27 | PERMALINK | EDIT/DEL | REPLY

    저랑 똑같은 일을 당하셨군요..... 트랙백 보내봅니다.
    그나저나 원저작자가 신고하면 원상복귀해줘야 되는데 고객센터에 문의해보니 어쩌구저쩌구...
    다음은 바로 처리해줬는데 말이죠 ㅠ_ㅠ

    아 그 제 블로그 글 통째로 긁어간놈 생각하면 아직도 화가납니다.;;

  • Favicon of http://www.yebigun1.mil.kr/homepage/Home.jsp BlogIcon 님아최고에요 | 2007.08.15 17:48 | PERMALINK | EDIT/DEL | REPLY

    너구리도 그렇고 광복절특사..아르란 사람은 게이버블로그 운영자라 이해하지만 이 두 듣보잡들은 네이버에 발려서 빌빌되는 다음직원인 아니면 구글 직원이겠구만 니들 말처럼 -_-ㅋ

    • 광복절특사 | 2007.08.15 20:06 | PERMALINK | EDIT/DEL

      그럼 너는 뇌이버 직원이구나? 푸훗!

  • Favicon of http://blog.orir.net/ BlogIcon pei | 2007.08.15 18:20 | PERMALINK | EDIT/DEL | REPLY

    아르//최근 네이버 검색결과에서 티스토리가 밀려나게 되는 점은 저역시 티스토리 유저이기에 불만스럽게 생각합니다.
    그런데 밀려나게 되는 이유나 구체적인 언급 없이, 추측으로 판단하는 글들이 너무 많이 올라온다고 생각됩니다.

    너구리//제대로 못할거면 시작을 말아야 한다는 논리는 좀 의아스럽습니다.
    웹에서 펌글을 걸러낸다는 것은 원작자와 펌자의 양심이 아닌이상 불가능에 가깝습니다.
    따라서 펌글이 난무하는 네이버 블로그로 인해, 네이버 검색결과 역시 중복글과 펌글로 난무하는 상황이죠.
    이런 상황에서, 네이버도 스스로 검색결과 질을 높이기 위해, 개선하고 노력하고 있습니다.
    (제가 직접 본게 아니라, 블로거간담회에 다녀온 블로거나 그밖의 여러 글들을 볼때...)
    100% 걸러내지 못할거면, 아예 노력조차 안되는 겁니까?
    차차 개선해나가는 것이 아니라, 완벽하기 전엔 시도조차 안된다는 논리는 전혀 이해가 안갑니다.
    되는대로 벌려놓고 손뗀게 아니라, 차근차근 개선해나가는 상황 아닌가요.

    광복절특사// 절 관찰해주시는 분이 계셨다니, 놀랍군요 ㅎㅎ
    전 네이버까 뿐만 아니라, 구글빠 애플빠 MS까도 극도로 싫어합니다ㅎㅎ

    • Favicon of https://rinapc.com BlogIcon 리나 | 2007.08.15 19:51 신고 | PERMALINK | EDIT/DEL

      중복된 결과 걸러낸 건 어느 정도 만족스럽지만...
      원본을 판단하는데 있어 네이버 블로그를 우선으로 처리하는 것 같아 이것이 문제라는 겁니다.

  • 광복절특사 | 2007.08.15 20:10 | PERMALINK | EDIT/DEL | REPLY

    푸헐~ pei이 이사람 참 웃기네요. http://blog.orir.net/52에 리나님의 글에 대한 변명 비슷하게 올렸습니다. 자신에 네이버 빠돌이라는 건 인정하네요. 그리고 악플달려면 주소 알고 까라고? 헐~ 주소 달고 까면 악플달아도 된다는 소린가 봅니다. 저러니 물불 안가리고 네이버 비판글엔 악플 달기에 혈안이지..쯧쯧.. 저러고도 올블 100대에 끼었다니...

  • Favicon of http://neoframe.tistory.com BlogIcon neoframe | 2007.08.15 21:36 | PERMALINK | EDIT/DEL | REPLY

    중복 비교 중복 검색이 된다면 중복으로 판명된 컨텐츠 중 최초 등록된 컨텐츠를 "최초글" 정도로 가장 위에 보여주고 중복된 내용들은 그 아래 "펼치기"로 보여주면 좋겠다 싶네요. 근데 이건 이전 검색 방식에서도 등록일 순으로 정렬 하면 수동으로나마 확인해볼 수 있는 내용 아닐까요;;

    네이버 카페, 블로그 외에 웹 상의 모든 데이타 대상으로 중복 비교 검색 돌리는 게 부담이라면 티스토리 이글루 조인스 블로그 등 주요 블로그만 대상으로 해도 반 수 이상 원본글, 최초글 찾아줄 수 있을 것 같은데.. 향후 계획 쯤으로라도 중복 비교 확대에 대해 언급된 내용이 없다는 게 아쉽습니다. 네이버 블로그/카페의 "최초로 퍼간" 글을 원본글이라며 우선적으로 보여준는 방식은 지적하신 많은 분들 말씀처럼 경쟁사 블로그 서비스 (티스토리, 이글루 등) 따시키기로 보일 소지가 많기도 하고 오해의 소지가 있는 이상한 개편 같습니다...

    • Favicon of https://rinapc.com BlogIcon 리나 | 2007.08.18 10:10 신고 | PERMALINK | EDIT/DEL

      "펼치기" 도 괜찮을 것 같네요.
      네이버가 판단한 원글과 펌글이 표시되니 곤란하려나... ^^

  • Favicon of http://www.seoinkorea.com BlogIcon SEO | 2007.08.15 22:19 | PERMALINK | EDIT/DEL | REPLY

    올리신 글 잘 보았습니다.
    불펌이나 중복문서 판독은 이미 구글등에서 시행되고 있지만 완전치는 않습니다.
    특히 네이버의 시도는 당연한 것이지만 아래의 NHN에서 밝힌 것처럼 스스로 자기네 늘력이 딸림을 스스로 폭로한 꼴입니다.
    ...........
    "네이버는 카페, 블로그, 뉴스 뿐만 아니라 웹문서, 전문자료 등으로 그 대상을 점차 늘려나갈 계획하고 있습니다. 또한 향후, 판독을 더 정교하게 할 수 있도록 기술적인 장치들도 지속적으로 추가하고 있습니다.
    ...........
    즉, 웹문서가 필터링 비교 대상에 들어가지 않으면 반쪽짜리 밖에 안된다는 것입니다.
    또한 웹문서를 포함하려면 구글처럼은 못해도 최소한 전체 한글웹페이지를 수집해야하는데 아마 수천 수만대의 서버를 증설해야할 것입니다.

    실례를 들께요.
    제가 운영하는 사이트에 최초 원본 글을 올렸습니다.(7월 초)
    그 다음 네이버 블로그에 복사해서 올렸습니다. 그 다음 7월 중순 어떤 블로그(티스토리사용)가 제글을 퍼가서 올렸습니다.
    그 블로그는 제가 항의도 했었고 펌글이 하도 많아서 결국 계정이 삭제되었습니다.
    그런데 얼마 전까지만해도 불펌블로그글이 상위에 노출이 되어 있었습니다.
    지금도 그 블로그포스트는 하위페이지 이긴하지만 노출이 되며 실제 들어가보면 삭제된 계정이라는 페이지가뜹니다.
    어쨋든 지금은 네이버블로그글이 상위로 갔지만 최조 원글은 제사이트의 웹페이지에 있습니다.
    물론 웹페이지 검색에서도 노출이 안됩니다.

    결국 네이버가 말하는 것은 반쪽개선에 불과하고 이 와중에 윗분들의 우려도 현실화 되지 않을까 우려되기도 합니다.
    실제로 제가 꾸준히 보아오던 몇몇 검색어에선 네이버블로그의 상위위배치가 눈에 띄기도 합니다.
    네이버가 서버를 왕창증설해서 네이버봇을 제대로 가동시키기 전에는 모든게 요원합니다.
    차리리 구글데이타를 이용하는 다음이 더 빨리 쉽게 중복콘텐츠 필터링을 할 수 있을 것입니다.

    • Favicon of https://rinapc.com BlogIcon 리나 | 2007.08.18 10:11 신고 | PERMALINK | EDIT/DEL

      댓글 감사합니다.
      Seo 님 사이트는 회원제라서 글읽기가 안 되는군요. ^^

  • 지나가는사람 | 2007.08.15 22:29 | PERMALINK | EDIT/DEL | REPLY

    이러저러해도 이러한 비판들이 있기 때문에 조금 더 나은 품질과 조금 더 나은 만족도를 위해서 개발자들은 열심히 일하고 있습니다. 그냥 회사에서 주는 돈이나 받아먹고 자리만 지키고 있는건 아닙니다.
    제대로 못할거면 아예 하지를 말던가 라는식의 말은 참으로 기운빠지게 하는 말이 아닐 수 없습니다.
    그들도 사람입니다. 누구나 완벽할 수는 없는겁니다.
    바뀌어간다라는것 자체에 의미를 두어야 하지 않겠습니까? 첫술에 배부를 수는 없는거니까요.
    돌이켜보면 올해 상반기 이러저러한 비판들속에서도 네이버는 계속 바뀌어오고 있었지 않습니까
    네이버 관계자가 아니지만 너구리님의 댓글은 같은 개발자 입장에서 불쾌하면서 씁쓸하군요.
    개발자이야기라는 카툰이 생각이 납니다...

  • Favicon of http://soooprmx.com/wp BlogIcon sooop | 2007.08.15 23:07 | PERMALINK | EDIT/DEL | REPLY

    전 워드프레스 사용자입니다. 네이버 검색 엔진이 가장 많은 방문을 해주고 있는데, 어째 리퍼러 페이지로 들어가면 제 블로그로 나는 링크는 거의 없습니다. 링크가 나 있어야 리퍼러로 나오는거 아닌가 싶은데... 아무튼 네이버가 외부 자료에 대해 '원본'에서의 우선순위에서 배제한다는 일종의 음모론은 음모론일수도 있지만, 그동안 외부 유저의 UCC에 대한 저작권을 무슨 개똥으로 알아온 네이버(는 사실 펌자료들이 난무해도 트래픽 장사만 하면 되니까)의 과거 행각으로 미루어 충분히 의심할만하다고 생각됩니다.

  • Favicon of http://orcl.tistory.com BlogIcon Qhtlr | 2007.08.16 09:39 | PERMALINK | EDIT/DEL | REPLY

    티스토리 블로그는 검색에서 후순위에 있고
    포탈사이트의 블로그 펌글이 1순위에 있네요

  • Favicon of http://kebie.linuxstudy.pe.kr/blog.html BlogIcon kebie | 2007.08.16 19:01 | PERMALINK | EDIT/DEL | REPLY

    사람이라도 글을 다 읽어봐도 원본글과 불펌글을 구별 할 수 없는 경우가 많은데... 그걸 컴퓨터가 할 수 있을리가 없죠. ^^; 아마도 중복된 결과 여러개를 하나로 묶어서 보여준다는 정도를 말한 겁니다. html 소스 에디터로 치자면 폴딩 기능같은 거죠... 이걸 너무 큰 기대를 가지고 확대해석 하는 것 때문에 이런저런 오해들이 많이 생기는 것 같습니다...

    • Favicon of https://rinapc.com BlogIcon 리나 | 2007.08.18 10:21 신고 | PERMALINK | EDIT/DEL

      예. 물론 구별이 힘든 건 맞겠지만 네이버 블로그를 우선으로 한다는 것이 문제가 아닐지... ^^

  • Favicon of http://damoa.tistory.com BlogIcon 나란트 | 2007.08.16 23:06 | PERMALINK | EDIT/DEL | REPLY

    음... 네이버 정말 문제입니다. 외부 검색엔진들이 찾아오는 퍼미션을 모두 닫아놓고 지들은 마구 검색해 가는것도

    문제지만... 저 따위 검색 시스템도 문제네요... 분명 펌글의 대부분이 뉴스라 뉴스에 대해 중복검사를 문단단위까지

    적용하겠다고 한것인데...

    검색엔진을 하나 만들어야 겠네요 ㅎ

Name
Password
Homepage
Secret