ja temos uma versão dev do pacote que usa match probabilistico dos logradouros. Isso deixa o processamento mais demorado, mas melhora os resultados. Caso você queira testar, pode instalar a versão dev desse branch aqui. Estamos em fase de teste, então qualquer feedback seria muito bem vindo.
A atual versao atual calcula distancia de string dos logradouros usando a função jaro_similarity()
, que é nativamente implementada no duckdb.
Uma alternativa seria o coeficiente de dice, mas teria q implementar a função no SQL.
RetroSearch is an open source project built by @garambo | Open a GitHub Issue
Search and Browse the WWW like it's 1997 | Search results from DuckDuckGo
HTML:
3.2
| Encoding:
UTF-8
| Version:
0.7.4