Performance "za hodinu", aniž by PerfStat nebo Ops Mgr
PerfStat je skvělý způsob, jak získat některé velmi podrobné informace o výkonnosti z Filer, když máte na výkon nebo jinými otázkami, které nelze zcela dát prst. Musíte mít přístup k divákovi PerfStat, nebo sehnat někoho, kdo se s tímto výstupem pro vás, a pak je třeba probírat to.
Operations Manager, konkrétně Performance Advisor je brilantní a 99% času vám čítače je třeba diagnostikovat problém. Poté, co jste našli cestu kolem, je to naprosto nezbytné!
Ale co když nemáte Operations Manager, nebo si jen chcete rychle vytáhnout informace o jedné oblasti systému?
První věci, které chcete se podívat na sysstat. Každý, kdo je nejlepší přítel a skvělý způsob, jak vidět "Je můj systém práce?". Kdykoliv spustíte sysstat, ujistěte se, že přes to "-s" modifikátor tak, že dostanete shrnutí na konci výstupu. Pokud nechcete definovat počet iterací (-c <num>), pak Ctrl + C rozbít výstup. "-X" je skvělý pro poskytování všech oblastech výkonu, ale může to být někdy trochu široký. "-U" je můj oblíbený, protože umožňuje využití čtení a tyto zpravidla velmi užitečné při řešení problémů.
Většina sloupů je docela samozřejmý. CPU% obsazeno, NFS, CIFS, HTTP, FCP a iSCSI jsou všechny operace protokolu čítače. Čistá kB / s dovnitř a ven jsou zřejmé (pro referenční jediné gigabitové rozhraní šťastně udržet kolem 80 MB / s, ale může protáhnout až 110/120MB/s). Diskových a páskových in & out. Podívejte se na vyrovnávací věku, kdy se dostane opravdu nízká, ale je lepší čítače. Cache hit je počítadlo, které chcete v téměř 100%, jak je to možné. Čím více dat je dostat čtení z cache, tím lépe! CP typu je důslednost bodů, nebudu zacházet do podrobností, co se jedná, je velmi dobrý KB článek na toto již (https://now.netapp.com/Knowledgebase/solutionarea.asp?id=kb23471) . A konečně Disk Využití který vypadá, že způsobí určitý zmatek. Jedná se o čtení z jednoho disku nejvytíženější v systému, a nikoli průměr. Toto čtení je zajímavé jít o 100% (stejně jako CPU taky), a to jednoduše znamená, že disky dělají více, než by měl!
Takže sysstat je skvělý způsob, jak získat vysoké úrovni s ohledem na "Je můj systém zaneprázdněn", a zároveň nabízí hrubou představu o tom, kde je zúžení. Pokud je CPU je opravdu vysoká, ale nic jiného, pak je to to, co je brzdí systém. Pokud je disk využití je velmi vysoká, na druhou stranu, tady je problém. Ale tyto nejsou přesvědčivé postavy, a ne přímo na místě viníkem. Například v případě využití disku je velmi vysoká, může být nutné spustit WAFL přerozdělit, jak jste přidali několik nových disků a nejsou žádná data zatím drží. Pokud je váš procesor je velmi vysoká, je možné, že děláte spoustu dalších zpracování, jako je A-SIS a SnapVault, nebo by to mohlo být velmi náhodné IO, takže procesor pracuje víc jsem se pokoušel provádět výpočty kolem tohoto.
Dalším krokem může být na pohled statit. "Priv nastavit další" příkaz, a ne na lest srdce, velký příkaz získat přehled o údaje za období. Jednoduše spusťte "statit-b" na začátku sledovaného období, a pak "statit-e" na konci. Ujistěte se, že k přihlášení výstupního okna, jak budete mít hodně z statit (více než standardní Windows a vyrovnávací tmel se zobrazí). Tam je spousta statit výstupu a nebudu příliš do podrobností v tom všem tady (ale možná jiný den). Většina z toho je docela samozřejmý fakt.
To mne přivádí na skutečný důvod k tomuto článku na prvním místě. Jeden z mých oblíbených příkazů, a jistě velmi přehlédl, "Statistiky". To má spoustu informací na jeho ruce, cokoliv se můžete podívat od v Performance Advisor, a vše, co můžete ve zprávě o PerfStats je k dispozici v příkazu statistiky. A možná mnohem více! "Statistiky" funguje velmi podobně jako sysstat v tom, že zprávy čítače na základě iterací. Pokud jste stačí spustit, bude to zpráva, co systém dělá, že v přesný čas. Řeknete-li, aby byl spuštěn každých 5 sekund, bude to zpráva, co se stalo za těch 5 sekund.
Takže nejprve se, to není jen a spusťte "statistiky show", aniž by pár minut čas. Výstup je velmi komplexní! Nejprve se chcete podívat, co pulty jsou k dispozici. Statistiky je rozdělena do "objekty", "instanci" a "počítači". Chcete-li zobrazit každý, můžeme použít "Statistiky seznam ..."
filer01> Statistiky Seznam objektů
Objekty:
skládka
logical_replication_source
logical_replication_destination
vfiler
qtree
celkový
iSCSI
FCP
CIFS
objem
lun
cíl
NFSv3
ifnet
procesor
disk
systém
filer01> Statistiky Seznam případech ifnet
Instance pro název objektu: ifnet
B2net
Skladování-101
filer01> Statistiky Seznam čítače ifnet
Čítače Název objektu: ifnet
recv_packets
recv_errors
send_packets
send_errors
kolize
recv_data
send_data
recv_mcasts
send_mcasts
recv_drop_packets
Jako příklad výše, mohu zobrazit všechny objekty, které mám k dispozici, mohu dotaz všechny sítě případech jsem setup (2 VIFs, 1 s VLAN), a vidím, co pulty můžu zprávu. Takže dávat to dohromady ...
filer01> Statistiky ukazují, ifnet: Skladování-101: kolize
ifnet: Skladování-101: kolizí: 0 / s
Skvělé, moje paměťové rozhraní nemá žádné síťové kolize pro období to má běžet! To je dobrá zpráva pro mě!
Když chci spustit tento přes několik iterací, můžu krmit víc možností. Poznámka: Volby se musí obrátit na počítadlo!
filer01> Statistiky show-n 5-I 1 ifnet: Skladování-101: kolize
Například kolize
/ S
Skladování-101 0
Skladování-101 0
Skladování-101 0
Skladování-101 0
Skladování-101 0
Skvělé, takže po dobu 5 sekund jsem ještě nedostávají kolize!
Všimněte si, z výše uvedeného, že existuje mnoho čítačů výkonu k dispozici, a ne všichni z nich mají nejvíce verbose jména. Dotaz lze některé z těchto spuštěním "Statistiky vysvětlit počítači".
filer01> Statistiky vysvětlit čítače kolizí ifnet
Čítače Název objektu: ifnet
Jméno: kolize
Popis: srážek za sekundu rozhraní CSMA
Vlastnosti: rychlost
Jednotka: per_sec
Tak Vezměme jiný příklad, chci se podívat na latence čtení na svém systému Exchange ...
filer01> Statistiky show-n 5-I 1 objem: exch01_db: read_latency objem: exch01_db: write_latency objem: exch01_logs: read_latency objem: exch01_logs: write_latency
Například read_latency write_latenc
ms ms
exch01_db 0 0
exch01_logs 0 0
exch01_db 0 0
exch01_logs 0 0
exch01_db 0 0
exch01_logs 0 0
exch01_db 0 0
exch01_logs 0 0
exch01_db 0 0
exch01_logs 0 0
Je 8 hodin ráno, žádný z prodejní tým je ještě vzhůru! Záhlaví sloupce se trochu zkosený, ale můžeme vidět latence čtení v prvním sloupci, latence a psát ve druhé.
Jeden z mých největších stížností sysstat je to, co se stane, když chci, aby byl tento běh po určitou dobu a log výstup? No, můžu změnit "možnosti autologout" a opustit své notebook zapojený do zásuvky, ale to nikdy dobrý nápad. "Statistiky" vám dává možnost, aby všechny výstupy potrubí statistiky přímo do souboru. Brilantní novinky!
filer01> Statistiky show-n 5-i 1-O / etc / stats.txt objem: exch01_db: read_latency objem: exch01_db: write_latency objem: exch01_logs: read_latency objem: exch01_logs: write_latency
filer01> rdfile / etc / stats.txt
Například read_latency write_latenc
ms ms
exch01_db 0 16,00
exch01_logs 0 0
exch01_db 0 0
exch01_logs 0 0
exch01_db 0 8,00
exch01_logs 0 0
exch01_db 0 0
exch01_logs 0 0
exch01_db 0 1,00
exch01_logs 0 0
Bohužel to není uvolnit konzoli, tak to psát z RSH a SSH, může být nejlepším řešením, ale dávejte pozor, jak dlouho se dostanete k opakování!
Další příjemnou vlastností je, že můžete mít nějaké přednastavení. Takže pokud máte 4 Exchange servery každý se 3 databáze, můžete načíst všechny objem: <vol_name>: Čtení / write_latency příkazy do souboru a tento problém přímo z příkazové statistiky. Předvolby soubory jsou XML soubory, takže si trochu myslel na psaní, ale pokud jste viděli XML předtím, tak to není tak složité.
My XML soubor vypadá následovně ...
<? Xml version = "1.0">
<preset>
<object name="volume">
<instance name="exch01_db">
<counter name="read_latency">
</ Pult>
<counter name="write_latency">
</ Pult>
</ Instance>
<instance name="exch01_logs">
<counter name="read_latency">
</ Pult>
<counter name="write_latency">
</ Pult>
</ Instance>
</ Object>
</ Předvolby>
Po uložení do souboru / etc / stats / předvoleb. "Xml" soubor, můžu volat přímo z příkazového statistiky.
filer01> Statistiky ukazují, P-exchange-i 1-N 5
Například read_latency write_latenc
ms ms
exch01_db 0 0
exch01_logs 0 0
exch01_db 0 0
exch01_logs 0 0
exch01_db 0 0,13
exch01_logs 0 0,12
exch01_db 0 0,00
exch01_logs 0 0,00
exch01_db 0 0
exch01_logs 0 0
Možnosti jsou obrovské pro toto, ale to se otevírá něco ještě lepšího. Nyní se můžeme použít "Statistiky start" a "statistiky stop" pro spuštění této zprávy a budu mít konzoli zpátky!
filer01> Statistiky start-P výměna
Statistiky identifikátor jméno je "Ind0x6920b2f0"
filer01> Statistiky ukazují, I Ind0x6920b2f0
StatisticsID: Ind0x6920b2f0
objem: exch01_db: read_latency: 0 ms
objem: exch01_db: write_latency: 5.14ms
objem: exch01_logs: read_latency: 0 ms
objem: exch01_logs: write_latency: 0.00ms
filer01> Statistiky stop-I Ind0x6920b2f0
StatisticsID: Ind0x6920b2f0
objem: exch01_db: read_latency: 0 ms
objem: exch01_db: write_latency: 5.36ms
objem: exch01_logs: read_latency: 0 ms
objem: exch01_logs: write_latency: 0.00ms
Doufám, že si začínají uvědomovat, proč mám rád tento příkaz, a proč se možnosti použití tohoto jsou obrovské, a že je opravdu velmi silný!
Poslední věc, kterou chcete přidat, existuje mnoho čítačů k dispozici standardně v normálním privilegovaný režim, ale zkuste přešel k pokročilé, nebo dokonce diag, a uvidíte, kolik přepážek je k dispozici,! To je ohromující, ale s trochou kopat, velmi silný.
A ještě poslední věc, kterou můžete použít zástupné znaky "Zobrazit statistiky" příkaz, tak vytáhnout všechny čítače pro mé databáze Exchange ...
filer01> Statistiky ukazují, objem: exch01_db: *
objem: exch01_db: avg_latency: 0.00ms
objem: exch01_db: total_ops: 3 / s
objem: exch01_db: read_data: 0b / s
objem: exch01_db: read_latency: 0 ms
objem: exch01_db: read_ops: 0 / s
objem: exch01_db: write_data: 12288b / s
objem: exch01_db: write_latency: 0.00ms
objem: exch01_db: write_ops: 3 / s
objem: exch01_db: other_latency: 0 ms
objem: exch01_db: other_ops: 0 / s
Nebo ukázat všechny read_latency pro všechny své svazky ...
filer01> Statistiky ukazují, objem: *: read_latency
objem: vol0: read_latency: 0 ms
objem: exch01_db: read_latency: 0 ms
objem: home: read_latency: 0 ms
objem: záloha: read_latency: 0 ms
objem: Podíl: read_latency: 0 ms
Pokud máte nějaké specifické dotazy, nebo chcete-li dotaz, jak získat konkrétní informace čítače ze systému, neváhejte a pošlete mi na otázku. Doufám, že to je užitečné pro každého!










































Statistiky je skvělý příkaz použít pro sběr dat pro dlouhodobé trendy také (v případě, že stejná data nejsou vystavena v SNMP MIB) - například za objem dat není k dispozici přes SNMP MIB - mám blogu o tom, jak sbírám to a poskytují některé např. grafy na http://aditya.grot.org/2009/02/netapp-ontap-per-volume-statistics.html
Některé velmi dostupné nástroje pro překlad výstupu z "statistiky" k dispozici na společenství NetApp - http://communities.netapp.com/docs/DOC-2092
velký příspěvek Chris, velmi poučné a už vůbec ne něco, co žádná z dokumentů "základy" - nebo dokonce technické zprávy Přečetl jsem tak daleko.