Google Cloud Lança Open Knowledge Format (OKF): O Novo Padrão para Conhecimento de Agentes de IA

O Google Cloud acaba de formalizar uma ideia que vinha ganhando força na comunidade de IA: a necessidade de um formato padronizado para que agentes de IA possam ler, escrever e compartilhar conhecimento organizacional. Nascia assim o Open Knowledge Format (OKF), anunciado em 12 de junho de 2026 por Sam McVeety e Amir Hormati, líderes técnicos do Google Cloud.

O OKF não é um serviço, plataforma ou runtime. É uma especificação aberta e neutra que transforma o conhecimento institucional em algo trivial: uma pasta de arquivos Markdown com frontmatter YAML. Sem SDK proprietário, sem vendor lock-in, sem banco de dados. Se você consegue fazer cat em um arquivo, você já sabe ler OKF.

O Problema que o OKF Resolve

Hoje, quando uma empresa quer construir um agente de IA que entenda seus dados internos — esquemas de banco, definições de métricas, runbooks de incidentes, caminhos de joins entre tabelas — o conhecimento está fragmentado em silos incompatíveis:

Catálogos de metadados com APIs proprietárias
Wikis corporativas
Comentários em código e docstrings
Documentos em drives compartilhados
A cabeça de alguns engenheiros seniores

Cada time reconstrói do zero a mesma lógica de montagem de contexto. Cada vendor reinventa os mesmos modelos de dados. E o conhecimento fica preso na ferramenta que o criou.

A Inspiração: O "LLM Wiki" do Karpathy

A ideia não surgiu do vácuo. Em abril de 2026, Andrej Karpathy publicou um gist que viralizou com mais de 5.000 estrelas, descrevendo o conceito de uma "wiki mantida por LLMs". A premissa: LLMs não ficam entediados, não esquecem de atualizar referências cruzadas e podem editar 15 arquivos em uma única passada.

O OKF pega esse padrão emergente e adiciona a camada de interoperabilidade que faltava. Como resumiu Chaz Chumley (@DataChaz): "O Google está formalizando o poder do LLM Wiki."

Como Funciona na Prática

Um bundle OKF é simplesmente um diretório de arquivos .md. Cada arquivo representa um conceito — uma tabela, dataset, métrica, API ou playbook. O caminho do arquivo é sua identidade.

Exemplo de estrutura:

sales/
├── index.md
├── datasets/
│   ├── index.md
│   └── pedidos_db.md
├── tabelas/
│   ├── index.md
│   ├── pedidos.md
│   └── clientes.md
└── metricas/
    ├── index.md
    └── usuarios_ativos_semanais.md

Exemplo de arquivo de conceito (tabelas/pedidos.md):

---
type: Tabela BigQuery
title: Pedidos
description: Uma linha por pedido concluído.
resource: https://console.cloud.google.com/bigquery?p=acme&d=vendas&t=pedidos
tags: [vendas, receita]
timestamp: 2026-05-28T14:30:00Z
---

# Schema

| Coluna        | Tipo   | Descrição                          |
|---------------|--------|------------------------------------|
| `pedido_id`   | STRING | Identificador único global.        |
| `cliente_id`  | STRING | Chave estrangeira para clientes.   |

# Joins

Unido com clientes via `cliente_id`.

Princípios de Design

O OKF segue três princípios fundamentais:

Minimamente opinativo — Apenas o campo type é obrigatório. Todo o resto é decisão do produtor.
Independência produtor/consumidor — Um bundle escrito por um humano pode ser lido por um agente. Um bundle gerado por pipeline pode ser navegado visualmente. O formato é o contrato.
Formato, não plataforma — Sem lock-in de cloud, banco de dados, modelo ou framework. Nenhuma conta proprietária é necessária.

OKF vs. Alternativas

O que diferencia o OKF de abordagens existentes:

Abordagem	Armazenamento	Portátil	SDK necessário	Legível por agentes
OKF v0.1	Markdown + YAML	Sim	Não	Sim, sem tradução
Notion	Banco proprietário	Apenas exportação	API necessária	Via API
Obsidian vault	Arquivos Markdown	Sim	Não	Convenções próprias
Catálogo de metadados	Vendor store	Apenas exportação	SDK do vendor	Específico do vendor
RAG index	Vector store	Não	Sim	Chunks, não conceitos

Diferença crucial do RAG: RAG recupera chunks brutos e re-deriva conhecimento a cada query. OKF armazena conceitos curados e interligados que o agente lê e atualiza diretamente, com controle de versão.

O Que Foi Lançado

Junto com a especificação, o Google publicou três implementações de referência:

Agente de Enriquecimento — Percorre datasets do BigQuery e redige conceitos OKF para cada tabela/view, depois os enriquece com citações, schemas e paths de joins usando uma segunda passagem de LLM.
Visualizador HTML Estático — Converte qualquer bundle OKF em um grafo interativo em um único arquivo autocontido (sem backend, sem instalação, sem dados saindo da página).
Bundles de Exemplo — Três bundles prontos para navegar: dataset GA4 e-commerce, Stack Overflow público e datasets Bitcoin.

Tudo está disponível no GitHub em GoogleCloudPlatform/knowledge-catalog.

Por Que Isso Importa

O OKF ataca um ponto de dor real e universal: a fragmentação do conhecimento institucional. Em vez de mais uma ferramenta proprietária, o Google escolheu o caminho oposto — um formato aberto, mínimalo e portátil que qualquer um pode adotar.

Para times de dados, significa tratar conhecimento como código: versionar no git, revisar via PRs, automatizar com pipelines. Para agentes de IA, significa ter um "manual de instruções da empresa" que podem ler e atualizar sem depender de integrações frágeis.

Se o OKF ganhar adoção ampla, pode se tornar o "Markdown do conhecimento de agentes" — assim como o README.md virou padrão universal para documentação de projetos, o OKF pode virar o padrão para documentação que máquinas também entendem.