paint-brush
HackerNoon의 다국어 플랫폼: 모든 주요 뉴스가 이제 13개 언어로 제공됩니다.~에 의해@fabian337
1,496 판독값
1,496 판독값

HackerNoon의 다국어 플랫폼: 모든 주요 뉴스가 이제 13개 언어로 제공됩니다.

~에 의해 Marcos Fabian3m2022/11/21
Read on Terminal Reader
Read this story w/o Javascript

너무 오래; 읽다

HackerNoon은 기계 학습을 사용하여 우리 플랫폼의 모든 주요 뉴스를 영어에서 스페인어, 힌디어, 중국어, 베트남어, 프랑스어, 포르투갈어 및 일본어로 번역했습니다. 우리는 앞으로 나올 새로운 주요 뉴스를 계속해서 번역할 것입니다. 이제 주요 뉴스에서는 특집 이미지 위에 이러한 언어가 모두 표시됩니다. e는 기본 번역을 개선하기 위해 다양한 규칙과 도구를 탐색하고 있지만 장기적으로는 이러한 번역을 개선하기 위해 커뮤니티에 투자할 것입니다(나중에 더 많은 내용이 추가될 예정입니다!).
featured image - HackerNoon의 다국어 플랫폼: 모든 주요 뉴스가 이제 13개 언어로 제공됩니다.
Marcos Fabian HackerNoon profile picture
0-item



새로 추가된 내용: 이 기능에 5개의 새로운 언어를 추가하여 HackerNoon에서 사용할 수 있는 언어 수가 총 13개로 늘어났습니다! 새로운 언어에는 다음이 포함됩니다. 러시아인 , 한국인 , 터키어 , 독일 사람 그리고 벵골 사람 .


현재 세계 인구는 약 80억인데 왜 미국 인구를 3억 3,190만 명으로 목표로 삼을까요? 글쎄요, 우리는 불가능하고, 상상할 수 없고, 예측할 수 없는 일을 해냈습니다. HackerNoon 에서 우리는 (적어도 우리는) EARTH의 모든 사람에게 인터넷 접속을 제공하여 세상을 움직이는 관련 콘텐츠를 공정하게 읽을 수 있는 기회를 제공하고자 합니다.

방금 무슨 일이 일어났나요?

우리는 기계 학습을 사용하여 우리 플랫폼의 모든 주요 뉴스를 영어에서 스페인어 , 힌디어 , 중국어 , 베트남어 , 프랑스어 , 포르투갈어일본어 로 번역했습니다. 우리는 앞으로 나올 새로운 주요 뉴스를 계속해서 번역할 것입니다. 이제 주요 뉴스에서는 특집 이미지 위에 이러한 언어가 모두 표시됩니다.


또한 특정 언어의 태그 페이지로 이동하면 전체 페이지가 해당 특정 언어로 표시되는 것을 확인할 수 있습니다. 예를 들어 https://hackernoon.com/tagged/hackernoon-hi는 특정 언어(이 경우 힌디어)로만 표시됩니다. 하지만 다른 언어에서도 마찬가지입니다.

왜 이러한 언어를 사용합니까?

글쎄, Jefferson 이 만든 새로운 설문 조사 시스템 덕분에 우리는 사용자에게 어떤 언어로 기사를 읽고 싶은지 물어볼 수 있었습니다. 우리는 또한 기존 독자층과 상호 참조했습니다. 여론조사 결과는 매우 명확했기 때문에 우리는 계속해서 진행하기로 결정했습니다. 프로젝트. 여기 에서 결과를 확인하세요. 우리는 사용자의 의견을 경청하기 때문에 우리가 구축하는 모든 것이 유익한지 확인하고 싶습니다. 그래서 스페인어가 번역된 첫 번째 언어였고 그 다음에는 나머지 언어로 옮겼습니다. HackerNoon 스토리를 찾는 새로운 독자의 수가 늘어나면서 이러한 번역의 효과는 놀라웠습니다.

어떻게 만들어졌나요?

우리는 Google Translation API 로 시작했습니다. 우리는 정확성을 매우 좋아하며 다양한 팀 과 함께 대부분의 언어 내용을 확인하여 기사 번역이 신뢰할 수 있는지 확인할 수 있습니다. API의 단순함을 보고 이것이 최선의 선택이었다고 생각합니다. 우리는 기본 번역을 개선하기 위해 다양한 규칙과 도구를 탐색하고 있지만 장기적으로는 이러한 번역을 개선하기 위해 커뮤니티에 투자할 것입니다(나중에 더 많은 내용이 추가될 예정입니다!). 우리는 또한 원본 콘텐츠와 구별하기 위해 번역된 기사를 저장할 새 데이터베이스를 만들었습니다. 물론 둘 사이에는 어느 정도 상관관계가 있습니다.

프레임 워크

이 프로젝트에서 가장 어려운 부분은 특정 페이지의 언어로 특정 페이지의 정적 데이터를 로드하는 프레임워크를 만드는 것이었습니다. 여기서 아이디어는 누군가가 프랑스어 로 된 이야기를 읽는 경우 "new story"와 같은 정적 데이터(변경되지 않는 텍스트)가 "Nouvelle histoire"와 같은 번역된 버전을 표시한다는 것입니다. 이는 다른 언어에서도 마찬가지입니다.


이를 수행하는 방법에는 여러 가지가 있습니다. 저는 단순히 각 언어의 텍스트를 저장하는 개체를 만들고 데이터베이스에 개체를 저장한 다음 페이지 언어에 따라 API를 통해 로드하기로 결정했습니다. 정적 번역이 완료된 후 남은 것은 실제로 스크립트를 통해 주요 뉴스를 번역하는 것뿐이었습니다. 그것은 긴 과정이었고 모든 이야기를 이 모든 언어로 번역하는 데 약 2주가 걸렸습니다. 더 좋은 점은 번역된 모든 스토리가 페이지 언어로 된 메타데이터와 함께 HackerNoon 사이트맵 에 추가된다는 점입니다. 이는 확실히 공유 경험을 촉진할 것입니다. Google에서 베트남어 로 다음과 같이 검색해 보세요.

여러분 모두가 모국어로 읽고, 댓글을 달고, 공유하는 것을 즐기시기 바랍니다!