Google 搜索提供了多项与翻译相关的功能,让用户能够访问经过翻译的内容。如果您是广告网络运营方,但广告无法在已翻译的网页上正常投放,您需要按照本指南中的步骤确保广告能够正确呈现或归因。
我们的方法 #
当用户从搜索结果中访问由谷歌翻译提供的翻译内容时,用户点击翻译搜索结果后,Google 会从发布商处检索相应网页、重写源网址,并翻译该网页。
将谷歌翻译网址转换为原始网址 #
如果您运营的广告网络依赖于发布商的源网址,您需要转换谷歌翻译网址,确保广告能正常投放。请按照以下步骤解码发布商的主机名:
- 移除 .translate.goog 后缀,从主机名中提取网域前缀。
- 根据 ,(英文逗号)字符拆分 _x_tr_enc 参数,并将其保存为 encoding_list。
- 将 _x_tr_hp 参数的值附加到网域前缀前面(如果存在)。
- 如果 encoding_list 包含 1 且输出以 1- 开头,请从第 2 步的输出中移除 1- 前缀。
- 如果 encoding_list 包含 0 且输出以 0- 开头,请从第 3 步的输出中移除 0- 前缀。如果您移除了相关前缀,请将 is_idn 设为 true;否则,请将 is_idn 设为 false。
- 将 /\b-\b/(正则表达式)替换为 .(点)字符。
- 将 –(双连字符)字符替换为 -(连字符)字符。
- 如果 is_idn 设置为 true,请添加 Punycode 前缀 xn--。
- 可选:转换为 Unicode。
JavaScript 代码示例:从谷歌翻译网址中解码出主机名 #
function decodeHostname(proxyUrl) { const parsedProxyUrl = new URL(proxyUrl); const fullHost = parsedProxyUrl.hostname; // 1. Extract the domain prefix from the hostname, by removing the ".translate.goog" suffix let domainPrefix = fullHost.substring(0, fullHost.indexOf('.')); // 2. Split _x_tr_enc parameter by "," (comma), save as encodingList const encodingList = parsedProxyUrl.searchParams.has('_x_tr_enc') ? parsedProxyUrl.searchParams.get('_x_tr_enc').split(',') : []; // 3. Prepend value of _x_tr_hp parameter to the domain prefix, if it exists if (parsedProxyUrl.searchParams.has('_x_tr_hp')) { domainPrefix = parsedProxyUrl.searchParams.get('_x_tr_hp') + domainPrefix; } // 4. Remove '1-' prefix from the output of step 2 if encodingList contains // '1' and the output begins with '1-'. if (encodingList.includes('1') && domainPrefix.startsWith('1-')) { domainPrefix = domainPrefix.substring(2); } // 5. Remove '0-' prefix from the output of step 3 if encodingList contains // '0' and the output begins with '0-'. // Set isIdn to true if removed, false otherwise. let isIdn = false; if (encodingList.includes('0') && domainPrefix.startsWith('0-')) { isIdn = true; domainPrefix = domainPrefix.substring(2); } // 6. Replace /\b-\b/ (regex) with '.' (dot) character. // 7. Replace '--' (double hyphen) with '-' (hyphen). let decodedSegment = domainPrefix.replaceAll(/\b-\b/g, '.').replaceAll('--', '-'); // 8. If isIdn equals true, add the punycode prefix 'xn--'. if (isIdn) { decodedSegment = 'xn--' + decodedSegment; } return decodedSegment; }
重新构建网址 #
- 使用原始网页的网址,将主机名替换为已解码的主机名。
- 移除所有 _x_tr_* 参数。
测试代码 #
您可以使用下表为代码创建单元测试。对于给定 proxyUrl,decodeHostname 必须与预期值匹配。
下表只能用于测试主机名解码代码。您需要确保网址的路径、片段和原始参数保留原样。
proxyUrl | decodeHostname |
---|---|
https://example-com.translate.goog | example.com |
https://foo-example-com.translate.goog | foo.example.com |
https://foo–example-com.translate.goog | foo-example.com |
https://0-57hw060o-com.translate.goog/?_x_tr_enc=0 | xn--57hw060o.com (⚡😊.com) |
https://1-en–us-example-com/?_x_tr_enc=1 | en-us.example.com |
https://0-en—-w45as309w-com.translate.goog/?_x_tr_enc=0 | xn--en–w45as309w.com (en-⚡😊.com) |
https://1-0—–16pw588q-com.translate.goog/?_x_tr_enc=0,1 | xn—-16pw588q.com (⚡-😊.com) |
https://lanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch-co-uk.translate.goog/?_x_tr_hp=l | llanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch.co.uk |
https://lanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch-co-uk.translate.goog/?_x_tr_hp=www-l | www.llanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch.co.uk |
https://a–aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa-com.translate.goog/?_x_tr_hp=a–xn--xn--xn--xn--xn————————–a | a-xn-xn-xn-xn-xn————-aa-aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa.com |
https://g5h3969ntadg44juhyah3c9aza87iiar4i410avdl8d3f1fuq3nz05dg5b-com.translate.goog/?_x_tr_enc=0&_x_tr_hp=0- | xn--g5h3969ntadg44juhyah3c9aza87iiar4i410avdl8d3f1fuq3nz05dg5b.com (💖🌲😊💞🤷♂️💗🌹😍🌸🌺😂😩😉😒😘💕🐶🐱🐭🐹🐰🐻🦊🐇😺.com) |