Q&A Part 3 - Najlepsze praktyki w zakresie optymalizacji

Wizualizacja Q&A to jedna z najbardziej zaawansowanych wizualizacji Power BI, mająca za zadanie umożliwiać użytkownikowi zadawanie pytań dotyczących biznesu używając języka naturalnego. Podstawy działania wizualizacji zostały opisane w artykule https://www.blog.bitpeak.pl/post/q-a-part-1-pytaj-power-bi-o-sw%C3%B3j-biznes-i-uzyskuj-odpowiedzi, natomiast poprawną konfigurację i „wytrenowanie” tej wizualizacji przedstawia artykuł https://www.blog.bitpeak.pl/post/q-a-part-2-naucz-power-bi-jak-udziela%C4%87-poprawnych-odpowiedzi-biznesowi. Warto jednak jeszcze przygotować odpowiednio model danych w Power BI, aby wizualizacja Q&A była w stanie poprawnie interpretować dane w nim zawarte i o tym właśnie będzie ten artykuł.
Q&A jest w stanie przyjąć kilka automatycznych założeń co do modelu danych:
Wielu użytkowników raportów używa dedykowanej tabeli do przechowywania miar. Aktualna wersja wizualizacja automatycznie rozpoznaje tę tabelę (ang. measure table).
Zdarzają się sytuacje, gdy zarówno tabela jak i kolumna współdzielą tę samą nazwę. Niegdyś sprawiało to problemy dla Q&A, obecnie problem został rozwiązany i nie trzeba dostosowywać modelu danych w takich sytuacjach.
Jednak istnieje szereg czynności, które muszą zostać wykonane manualnie:
Dodanie brakujących relacji. W sytuacji, gdy w modelu danych brakuje odpowiednich relacji, Q&A nie jest w stanie zinterpretować jak powinno łączyć się dane między tabelami. W takiej sytuacji odpowiedzi będą udzielone poprawnie jedynie dla pytań obejmujących pojedynczą tabelę.
Weryfikacja nazw tabel i kolumn. Niezwykle istotne jest, aby nazwy tabel i kolumn wiernie odzwierciedlały dane znajdujące się w nich. Nazewnictwo powinno być możliwie jak najbardziej biznesowe. Należy unikać skrótów, pojęć technicznych lub innych, niewiele mówiących biznesowo kodów.
Weryfikacja poprawności typów danych. Podczas importu danych, należy zwrócić uwagę czy typy danych są odpowiednie. W szczególności może zdarzyć się tak, że kolumny liczbowe lub datowe są importowane do Power BI jako tekst, co stwarza wizualizacji Q&A spore problemy interpretacyjne.
Domyślne agregacje. Domyślnie, Power BI próbuje agregować wszelkie kolumny liczbowe. Może się zdarzyć, że użytkownik nie potrzebuje takiego zachowania dla części kolumn (bardzo częstym przypadkiem są kolumny typu rok, miesiącczy dzień, a także kolumna id). Należy w takiej sytuacji zmienić ustawienie Default Summarization na Don’t Summarize dla wybranych kolumn.
Kategorie danych. W przypadku, gdy dla danej kolumny określona jest kategoria danych, Power BI jest w stanie dużo lepiej dopasować typ wizualizacji. Przykładowo, jeśli dane oznaczone są jako geograficzne, z dużą dozą prawdopodobieństwa wynikiem wizualizacji Q&A będzie mapa.
Normalizacja modelu danych. Wizualizacja Q&A daje najlepsze wyniki, jeśli model danych jest znormalizowany. Oznacza to z grubsza, że dla każdego unikalnego obiektu dla użytkowników biznesowych powinien być stworzony dokładnie jeden obiekt w modelu (tabela lub kolumna). Przykład może być zobrazowany poniżej:

Rys. 1 – Tabela „Suppliers” przed normalizacją

Rys. 2 – Znormalizowane tabele „Suppliers” i „Contacts”
Atomowość danych. Power BI nie jest w stanie dokonywać analiz na podstawie fragmentów długich sformatowanych tekstowych kolumn. Jeśli tylko jest taka możliwość, dane powinny być rozdzielane na mniejsze fragmenty, co pozwoli na szereg dodatkowych analiz.
Podsumowanie
Niniejszy artykuł zamyka serię traktującą o wizualizacji Q&A. Polecam zapoznanie się również z dodatkowymi tips&tricks odnośnie zadawania pytań: https://docs.microsoft.com/en-us/power-bi/consumer/end-user-q-and-a-tips. Gorąco zachęcam do eksperymentowania z Q&A w swoich raportach i życzę zwiększania komfortu pracy z Power BI przy użyciu tej wizualizacji.
Mateusz Bargieł
Business Intelligence Consultant