Czy udało się dostrzec coś nadzwyczajnego w zarejestrowanych danych lub czy pojawiała się jakaś anomalia w danych pomiarowych, tych przesyłanych czy agregowanych? Akwizycja i zbieranie danych powinny pomagać nam w uzyskiwaniu użytecznych informacji, a nie dezorientować nas. Aby otrzymywać ważne informacje z danych przemysłowych należy wziąć pod uwagę opisane w artykule pięć strategii.
Co właśnie zobaczyłem? Każdy z nas miał taką myśl widząc coś nadzwyczajnego lub niewiarygodnego. Mógł to być np. zaskakujący filmik w Internecie, powtórka w transmisji meczu albo jakaś realna sytuacja w życiu, która sprawiła, że powiedzieliśmy “Zaraz…Co takiego?!”.
Artykuł nie zadaje pytań o sensowność zbierania danych czy wyniki otrzymywane z algorytmów przetwarzania danych. Sęk w tym, że systemy zbierania danych powinny pomagać nam w uzyskiwaniu istotnych, ważnych informacji, a nie zadziwiać czy dezorientować.
Dlatego też potrzebne są jakieś proste praktyki, które sprawią, że systemy Przemysłowego Internetu Rzeczy (IIoT, ang. Industrial Internet of Things) i związane z nimi duże zbiory danych, będą oferowały coś wartościowego. Wydaje się, że istnieje pewien mit, który mówi, że jeśli zbierana jest wystarczająca ilość danych w systemie, który jest wystarczająco „inteligentny”, aby je wszystkie przetworzyć, to zostaną uzyskane użyteczne wyniki. Ale czy naprawdę? Czy jeżeli zostaną wykorzystane terabajty danych historycznych oraz algorytm uczenia maszynowego (ML, ang. machine-learning), to otrzymamy odpowiedzi na wszystkie pytania, których poszukiwaliśmy? Prawdopodobnie nie.
Korelacja a przyczynowość
Przyczynowości nie można uzyskać tylko dlatego, że występuje korelacja pomiędzy jakimś dwoma zbiorami danych. Celem jest pozyskanie przydatnych danych. Takich, które pomogą w uzyskaniu wielokrotnego zwrotu z inwestycji (ROI, ang. return on investment) w system zbierania danych. Na szczęście nie jest to trudne. Wystarczy rozważyć i wdrożyć kilka rozsądnych rozwiązań.
1. Częstotliwość zbierania danych
Istnieje bezpośrednia korelacja pomiędzy częstotliwością zbierania danych a ponoszonymi kosztami związanymi z instalacją i eksploatacją systemu akwizycji tych danych. Wysyłanie danych do chmury obliczeniowej jest łatwe do zrozumienia i nie jest już obecnie niczym zaskakującym. Prędkość przesyłu w Mbps, duża liczba komunikatów oraz terabajty gromadzonych i przetwarzanych danych mają swoją cenę. Nawet przy posiadaniu w zakładzie własnego rozwiązania dla takiego przetwarzania, nadal potrzebna jest sieć komunikacji, i to taka która jest w stanie obsługiwać wymaganą częstotliwość zbierania oraz ilość przesyłanych danych w celu ich przetwarzania. Oba te wymagane parametry przekładają się na koszty.
Dlatego bardzo sensownym jest pytanie “Jak często potrzebuję aktualizacji danych?”. Zapisywanie danych dotyczących warunków otoczenia co kilka milisekund jest prawdopodobnie przesadą, jednak zbieranie danych dotyczących drgań z częstotliwością raz na sekundę także nie da nam użytecznych danych. Dane muszą być zbierane z taką częstotliwością, która przekłada się na reprezentatywne zbiory danych. Prawidłową wartość częstotliwości zbierania danych determinują specyficzne wymagania danej aplikacji.
Na przykład producenci łożysk publikują specyficzne wartości częstotliwości monitorowania na podstawie własności fizycznych samych łożysk.
2. Dokładność danych
Dla zbierania danych, które reprezentują rzeczywiste warunki, ważna jest dokładność czujników. Czy konieczna jest znajomość wartości wilgotności względnej powietrza z dokładnością do jednej setnej procenta albo położenia siłownika z dokładnością do 1 mikrona? Jeżeli dokładność czujnika temperatury wynosi +/- 5° C, to czy jest to wystarczające? Zbierane dane muszą prawidłowo reprezentować parametry i własności danej aplikacji, aby można było na ich podstawie wyciągać właściwe wnioski.
Czujnik używany do wykonywania pomiarów części w procesie kontroli jakości, powinien mieć dokładność większą od tolerancji wymiarów tej części. Jeżeli temperatura otoczenia może wpływać na ten proces, to może być wymagana dokładność czujnika proporcjonalna do oczekiwanych fluktuacji temperatury, aby wiedzieć, czy istnieje ten wpływ czy nie. Posiadanie pewnej wiedzy na temat danej aplikacji, okazuje się niezmiernie pomocne w dobraniu takich czujników, które są zarówno dokładne jak i ekonomiczne dla systemu zbierania danych.
3. Rozdzielczość danych
Blisko powiązana z dokładnością, rozdzielczość danych ma wpływ na jakość odczytu danych z czujnika przez urządzenie rejestrujące. Na przykład rozmiar (np. długość słowa bitowego) punktu danych może uczynić różnicę pomiędzy danymi przydatnymi a bezużytecznymi. Zastosowany czujnik może dokonywać pomiarów z wymaganą dokładnością, jednak jeśli sterownik nie potrafi odczytywać danych z tego czujnika z taką samą dokładnością w całym zakresie fluktuacji wielkości mierzonej, to wysoka dokładność czujnika nie ma już znaczenia. Sterownik musi odczytywać dane z taką dokładnością, która jest wymagana w całym zakresie oczekiwanych wartości. Znajomość aplikacji dostarczy tu niezbędnych informacji i pomoże w znalezieniu takiego sterownika, który posiada prawidłową rozdzielczość dla obsługi danych wejściowych z czujników. Rozdzielczość ta jest konieczna dla dostarczania wiarygodnych i w efekcie użytecznych danych.

4. Synchronizacja danych
Niektóre ze zebranych punktów danych mogą wymagać ścisłej synchronizacji z innymi. Może to być ważne szczególnie przy zbieraniu danych z dużą szybkością. Rozważmy monitorowaną wartość parametru drgań, która odpowiada położeniu siłownika. Dobrze byłoby znać takie położenie siłownika, które odpowiada odczytowi specyficznej wartości parametru drgań, będącej poza granicami tolerancji, podczas cyklu maszynowego.
Aby ten pomiar był dokładny, dane dotyczące położenia i drgań siłownika muszą być zbierane tak, aby odpowiadały sobie wzajemnie w taki sposób, który odzwierciedla aktualne zachowanie się siłownika w czasie. Można to zrealizować albo za pomocą jednego sterownika, który odczytuje obydwie wielkości w tym samym czasie albo za pomocą synchronizacji dwóch sterowników, tak aby znaczniki czasowe obydwu zbiorów danych były zsynchronizowane.
W przypadku, gdy zbiory danych nie mogą być dokładnie skorelowane ze sobą w powtarzalny sposób, to dokładny pomiar zachowania się systemu nie będzie możliwy.
5. Znajomość aplikacji
To kwestia odnosząca się do wszystkich poprzednich 4 punktów. Znajomość aplikacji jest kluczem do zbierania właściwych danych i zamiany ich w dane użyteczne. Na podstawie podanych wcześniej przykładów łatwo jest wyobrazić sobie różne sposoby zbierania danych, które mogą prowadzić do nieporozumień. Ale nawet jeśli dane są dokładne i reprezentują rzeczywiste warunki, to czy są one właściwe?
Należy konsultować się z ekspertami.
Rzadko zdarza się, aby jedna osoba lub grupa rozumiała zasadę działania każdego podzespołu jakiejś maszyny, w szczególności z technicznego punktu widzenia. Bardziej prawdopodobne jest to, że technologie takie jak hydraulika, pneumatyka, silników elektrycznych i siłowników zostają połączone ze sobą, aby stworzyć jedną maszynę – w oparciu o wiedzę inżynierów różnych branż. Proste użycie czujników do zbierania danych historycznych z tej maszyny może nie dać takich wyników, które mają sens. Dlatego, konsultacja z ekspertami od poszczególnych podzespołów, może pomóc w szybszym uzyskaniu odpowiedzi na pytanie, których danych należy poszukiwać i w jaki sposób je poszukiwać. Wystarczy chwila namysłu, pewne proste praktyki zbierania danych oraz znajomość aplikacji i system zbierania danych może rozpocząć dostarczanie nam użytecznych, praktycznych informacji.
Allen Tubbs, menedżer produktu oraz Benjamin Menz, badacz danych. Obydwaj są pracownikami firmy Bosch Rexroth Corp.