Durante le mie ultime attività di installazione di cluster Nutanix, mi sono imbatutto in un problema che mi ha fatto uscire di matto.
In due casi, basati su hardware differenti, mi sono trovato in una situazione abbastanza anomala, che mi impediva di procedere con le configurazioni dei cluster.
In pratica, terminata la foundation, le NIC dei server venivano riconosciute con velocità differenti da un server all’altro, sebbene tutte identiche fisicamente e connesse agli stessi switch (con identici adattatori e cavi).
Premetto che le NIC utilizzate erano, in entrambi i casi, schede con porte a velocità 10/25 Gbps, ma connesse a switch con sole porte a 10Gbps.
Il comportamento anomalo era il seguente:
In Prism le schede venivano visualizzate con velocità differenti, alcune a 25G ed altre a 10G:
In pratica le schede venivano rilevate da Nutanix alcune a 10G ed altre a 25G, sebbene tutte intestate verso porte degli switch a 10G. Oltre tutto, la suddivisione delle porte a 10G o 25G non era identica tra i diversi server, impedendomi quindi di gestire correttamente l’inserimento delle NIC nei bridge definiti. Infatti, per poter inserire le schede nei bridge, Nutanix verifica che siano tutte connesse alla stessa velocità.
Come primo tentativo abbiamo provato a forzare la velocità delle porte a 10G lato switch, disabilitando l’auto negoziazione. Ciò però non ha portato alcun cambiamento lato Nutanix.
Ho per cui effettuato alcune ricerche nella documentazione Nutanix, trovando questo comando che forza la velocità lato AHV:
ethtool -s ethX speed 10000 duplex full autoneg off
Il comando va eseguito in AHV, forzando la velocità a 10000 per ogni scheda coinvolta (per sicurezza l’ho forzata a tutte le schede 25/10).
Così facendo, dopo qualche minuto, Prism ha rilevato correttamente tutte le schede a 10G, permettendomi di gestirle correttamente nei vari bridge.