📊Verileri Kategorize Etme

Yüksek sayıdaki verileri daha anlaşılır hale getirme

🔰 Bilinmesi Gerekenler

Çok yüksek veriler ile başa çıkmak zordur.

  • Kategorize işlemleri için birebir aynı metin aranmaz

  • Fuzzy Match olan yöntem ile çok benzeyen metinler aynı gruba alınır

🥴 Fuzzy Match

Kelimelerin birbirine çok yakın olanlarını bulur.

def fuzzy_match(word, s):
    words = set(word.split(' '))
    overlaps = [(k, len(v.intersection(words))) for k, v in s.items()]
    return max(overlaps, key=lambda x : x[1])[0]
split_names = {i: set(i.split(' ')) for i in shares.keys()}
for i in petro_companies:
    match = fuzzy_match(i, split_names)
    print("matched {} to {}".format(i, match))
    market_share[i] = shares[match]

Last updated

© 2024 ~ Yunus Emre Ak ~ yEmreAk