Google SEOアルゴリズムの流出内容に関するメモ
AnchorsAnchor
・context2で、アンカー周辺の用語をハッシュで受け取っている
・fontsizeをフォントの大きさ受け取っている
・sourceTypeでリンク設置元の品質を受け取っている
・isLocalで同じドメインかどうかを受け取っている
・firstseenDateで、リンクがは最初に表示された日数を受け取っている。
・compressedImageUrlsでアンカーに画像が入っている場合は受け取る
参考:https://hexdocs.pm/google_api_content_warehouse/0.4.0/GoogleApi.ContentWarehouse.V1.Model.AnchorsAnchor.html
GoogleApi.ContentWarehouse.V1.Model.FreebaseCitation
データの出典を正しく帰属させるために必要な情報を格納するための属性が定義。
dataset: データセットのMid(Machine ID)を格納する文字列型のフィールドです。
isAttributionRequired: このフィールドがtrueに設定されている場合、そのデータを使用する際に必ず引用が表示される必要があります。
project: データの出典となるプロジェクトの名前を格納する文字列型のフィールドです。
provider: この情報を提供したプロバイダーの名前を格納する文字列型のフィールドです。
statement: 人間が読める形式の引用文を格納する文字列型のフィールドです。
uri: このデータに関連するURIリンクを格納する文字列型のフィールドです。
参考:https://hexdocs.pm/google_api_content_warehouse/0.4.0/GoogleApi.ContentWarehouse.V1.Model.FreebaseCitation.html
GoogleApi.ContentWarehouse.V1.Model.ScienceCitation
科学的な文献や引用に関するメタデータを管理するための属性が定義。
学術的な引用情報の処理や管理に使用。
PatentPublicationNumber: 特許の公開番号を格納するフィールドです。
ISBNVariant: ISBNの異なるバリアントをリスト形式で格納します。
OnlineYear: オンラインで公開された年を表す整数型のフィールドです。
Number: このフィールドは1から3の範囲の数値を持ち、文献のナンバーなどを示すと考えられます。
Anchors: 引用元ページでのアンカーテキスト(前、後、正式など)をリスト形式で格納します。
PMID: PubMed IDを格納します。
PatentCountry: 特許が発行された国の2文字の国コードをリスト形式で格納します。
LegalCitation: 法的な引用情報を含むフィールドです。法律関連の文書では、通常のScienceCitationに対して法的なジャーナルのメタデータや引用情報を含めます。
PublicationDay: 特許の発行日を表すフィールドで、日を格納します。
Title: 文献のタイトルを格納します。
FileCreationYear: PDFやドキュメントの作成年を格納します。
funding: 文献の資金提供に関する情報をリスト形式で格納します。
AuthorMetatagLeftOver: 著者メタタグの残りの部分を格納します。
AbstractLanguage: 要約の言語を格納します。
NumBackwardLinks: gws(Google Web Server)で表示するための逆リンク数を格納します。
FileCreationMonth: ドキュメントの作成月をゼロインデックス(0が1月)で格納します。
ParseSource: 解析ソースを表す整数型のフィールドです。
PublisherAddress: 出版社の住所を格納します。
AbstractSource: 要約のソースを格納します。
ISSN: ISSN(国際標準逐次刊行物番号)を格納します。
VersionID: ドキュメントのバージョンIDを格納します。URLや出版者の書誌データから計算されたフィンガープリントです。
unioncatalog: ユニオンカタログの情報をリスト形式で格納します。
PMCID: PubMed Central IDを格納します。
ConferenceNumber: 会議の番号を格納します(例:「第27回魔法現実主義会議」)。
WorldViewable: この記事が世界的に閲覧可能かどうかを示すブール値です。
OnlineDay: オンラインで公開された日を表す整数型のフィールドです。
NumGoodEmbeddedRefs: 良質な埋め込み参照の数を格納します。
downloadurl: ダウンロードURLをリスト形式で格納します。
Series: 文献が属するシリーズを格納します。
NumSectionRefs: 特定のセクション内の参照数を格納します。
NumKeyQuotes: gwsで表示するための重要な引用の数を格納します。
AbstractCitationSource: 要約テキストのソースを選択する際に使用されるソースを整数型で格納します。
CitationSourceUrl: レコードの元となったURLを格納します。
Editor: 編集者のリストを格納します。
Language: 文献の言語を格納します。
Chapter: 章の情報を格納します。
alternateabstract: 代替要約をリスト形式で格納します。
PublicationVenue: 出版場所を格納します。これは、BibTeXから取得した本のタイトルや出版方法、ジャーナルなどを含みます。
NumBackwardLinksFromLegal: 法的展開のためのハックとしての逆リンク数を格納します。
Keywords: キーワードをリスト形式で格納します。
CrawledDocid: クロールされたバージョンとメタデータバージョンがマージされた場合、通常のdocidフィンガープリントを保持します。
AbstractHtmlLeftOver: AbstractHtmlの残りを格納します。通常、認識されていないXML/HTMLエンティティやタグが含まれます。
NumForwardLinks: gwsで表示するための順方向リンクの数を格納します。
BorrowedFields: FieldTypeの論理和を格納します。
FileCreationDay: ドキュメントの作成日を格納します。
AbstractText: 要約テキストを格納します。
PatentApplicationNumber: 特許の出願番号を格納します。
TitleHtml: 表示用のタイトルをHTML/XML形式で格納します。
accessurl: アクセスURLをリスト形式で格納します。
ClusterDiscoveryDate: クラスタの発見日を格納します。
PublicationMonth: BibTeXから取得した出版月をゼロインデックスで格納します。
CitationSrc: 引用元を格納します(例えば、dblp、CrossRef、論文など)。
TranslatedAuthorListHasEtAl: 翻訳された著者リストに「et al」が含まれているかどうかを示すブール値です。
alternatetitle: 代替タイトルをリスト形式で格納します。
subject: 主題をリスト形式で格納します。
JOI: ジャーナルオブジェクト識別子を格納します。
OtherID: その他のIDを格納します(例:ERICドキュメント番号、TR番号など)。
CitationSource: 引用元を整数型で格納します。
WOSID: Web of Science IDを格納します。
NumBackwardLinksInWoS: Web of Scienceでの逆リンク数を格納します。
NumRelated: gwsで表示するための関連する文献の数を格納します。
PublicationVenueVariant: 出版場所のバリアントをリスト形式で格納します。
BaseLocalID: インクリメンタルインデックスを構築する際に設定されるローカルIDを格納します。
CitationSourceCrawlTimestamp: 引用元のクロールタイムスタンプを格納します。
PublisherId: 出版社IDを格納します。
SICI: SICI(標準逐次刊行物コード)を格納します。
ArxivSection: ArXivのセクション(例:hep-ph)を格納します。
author: 著者のリストを格納します。
OnlineMonth: オンラインで公開された月をゼロインデックスで格納します。
PublisherOrg: 出版社の組織を格納します。
AbstractHtml: 表示用の要約をHTML/XML形式で格納します。
PatentClassification: 特許の分類(例:「B24B 3100」)をリスト形式で格納します。
Type: 文献の種類を整数型で格納します。
DEPRECATEDPublisherDisplayName: このフィールドは廃止され、DownloadURLに移動しました。
PatentNumber: 特許番号を格納します。
PubvenueID: ローカルジャーナル番号を格納します。
AbstractDisplay: 表示用の要約を格納します。
NumHostedPages: この引用のコンテンツをホスティングしているページ数を格納します。
Volume: 文献の巻号を格納します。
Edition: 文献の版を格納します。
NumRelated2: 実験用に関連する文献の数を格納します。
ISBN: ISBNを格納します。
DocumentID: ローカルのドキュメント識別子を格納します。
AlternateVersionID: クローリングおよび集約リライトを適用した後のURLのフィンガープリントを格納します。
category: カテゴリをリスト形式で格納します。
PatentOffice: 特許事務所を整数型で格納します。
ReviewTypeReason: レビュー記事の種類の理由をビットマップ形式で格納します。
DspaceID: Dspaceのハンドルを格納します。
AbstractTypeFromSource: ソースから識別された要約の元の種類を格納します。
UnmatchedInstitution: ドキュメント内で見つかったが、特定の著者に一致しなかった機関をリスト形式で格納します。
NumVersions: 文献のバージョン数を格納します。
PublicationYear: BibTeXから取得した出版年を格納します。
DOI: デジタルオブジェクト識別子を格納します。
referencediscussion: 引用の議論をリスト形式で格納します。
TitleHtmlLeftOver: TitleHtmlの残りを格納します。
translatedauthor: 翻訳された著者リストをリスト形式で格納します。
BorrowedAuthors: 著者ごとのビットを格納します。
ISSNVariant: ISSNのバリアントをリスト形式で格納します。
IncrementalExpected: この記事がインクリメンタルにインデックス化されることが予期されるかどうかを示すブール値です。
DblpId: DBLP IDを格納します。
BaseGlobalID: ベースインデックスに基づくグローバルドキュメント識別子を格納します。
ConferenceId: 会議シリーズの識別子を格納します。
LCCN: 米国議会図書館の分類番号を格納します。
DEPRECATEDMetadataSourceFile: このフィールドは廃止されました。
ClearedReason: クリアされた理由を格納します。
LevelOfDiscussion: このリファレンスの議論のレベルを表す整数型フィールドです。
AuthorListHasEtAl: 著者リストに「et al」が含まれているかどうかを示すブール値です。
NumRelated3: 実験用に関連する文献の数を格納します。
Note: ランダムな文字列データを格納します。解析されていないデータが含まれる可能性があります。
UnmatchedEmailAddr: ドキュメント内で見つかったが、一致しなかったメールアドレスをリスト形式で格納します。
Pages: ページ指定を扱うための文字列型フィールドです。内部構造は特に必要ではありません。
参考:https://hexdocs.pm/google_api_content_warehouse/0.4.0/GoogleApi.ContentWarehouse.V1.Model.ScienceCitation.html