Il Post piratato bene
Con la mia nuova routine genitoriale, che implica la sveglia prima della sveglia mediamente tra le 6 e le 7, ho aumentato la quantità di podcast che ascolto. Solutamente inizio la giornata con l'ultima puntata del Global News Podcast di BBC. Qualche volta, nel frattempo, esce Morning de Il Post. Lascio la definizione di podcast a un altro sproloquio ma il grande problema è che Morning è dietro il paywall del sito. Non posso insomma metterlo in coda su AntennaPod ma devo aspettare che finisca il podcast precedente, aprire una nuova app e ascoltarlo.
Nelle ultime settimane ho reinstallato sul mio server casalingo N8N e lo sto usando con grande entusiasmo (rispetto all’ultima volta è migliorato tanto ma soprattutto è migliorata l’AI e riesco a scrivere i blocchi di codici in un decimo del tempo). Mi sono quindi creato un’automazione che libera Morning dal giogo dell’app e lo trasforma in un vero feed rss.
Non entro nei dettagli, ma Il Post usa Wordpress come CMS e ha un po’ di punti interessanti:
-
Ogni pagina, inclusa quelle dei podcast, ha un feed rss (in Wordpress basta aggiungere /rss alla fine dell’indirizzo) che viene aggiornato tempestivamente con la pubblicazione di un nuovo contenuto. In questo feed però non c’è il nome del file ma può essere usato come trigger di uno script per recuperarlo.
-
Le puntate di Morning sono hostate in chiaro nel loro CMS ma protette da sicurezza per segretezza, a.k.a. senza sapere il nome del file non si riesce a scaricarle. E nel nome del file c’è lo Unix timestamp della pubblicazione, quindi auguri a fare bruteforce.
-
Il nome del file si trova come comodo JSON dentro un blocco JS in fondo alla pagine di ogni podcast ma viene iniettata solo per gli utenti loggati.
-
La pagina di login del Post di default è custom e in JS, ma la pagina wp-login.php è comunque attiva e permette un accesso molto facile tramite la libreria Selenium.
Insomma basta chiedere a uno script di fare login (ah, chiaramente serve un abbonamento pagato), scaricare la pagina del podcast, impachettare tutto in un file rss secondo le specifiche più comuni, hostarlo et voilà, il gioco è fatto. Morning è su AntennaPod.