Web Semantico, seo “Semantica”, Relazioni, Oggetti e Significati

Un approccio alla Semantica e al Web Semantico

A web of things, not strings

Da Wikipedia:

La semantica è quella parte della linguistica che studia il significato delle (semantica lessicale), degli insiemi delle singole lettere (negli e degli alfabeti antichi) e delle frasi (semantica frasale) e dei testi.

In pratica la semantica considera il rapporto tra l’espressione e la realtà extralinguistica, ovvero la realtà che ci circonda. Grazie alla semantica è possibile stabilire un nesso tra quello che “scriviamo” e “gli oggetti” che ci circondano. E di capirne il significato.

Da “seme”, la semantica studia dunque il significato delle parole, e le rapporta al mondo intorno a noi. Lo stesso concetto può essere applicato al Web Semantico, e, di conseguenza, alla seo e ai topic “semantici”.

Sul si parla di algoritmi, di RDF, di RDFa, di Semantic Web, di Latent Semantic Indexing. Il Semantic Web è un web di oggetti e relazioni tra essi, e in termini di seo il concetto è molto simile, dove diverse entità concettualmente reali sono associate tra loro, attraverso particolari istruzioni che vengono date ai motori di per associarle tra loro. Queste entità possono essere bob dylan, la chitarra, blowin’ in the wind, un concerto o la musica in generale, tutti collegati tra loro, dove tutti aiutano a definire meglio qualcosa stabilendo delle relazioni di vicinanza (potremmo dire semantica) tra di essi, come ad esempio bob dylan e la musica.

Nella seo si parla anche tanto del concetto di latente. Tale parola potrebbe indurre in inganno.

Latente (la·tèn·te/), aggettivo (da google)
– Che non si manifesta con alcun segno o sintomo esterno.

– In psicoanalisi: contenuto latente, il complesso degli elementi profondi del sogno, che giungono però alla coscienza di chi sogna in modo distorto e mascherato.

Quindi latente vuol dire che è presente (potremmo dire) “inconsciamente” nella persona, la quale vuole esprimere un concetto o un desiderio ma non lo fa in maniera esplicita. Come se io dicessi “chiudiamo le finestre”, e in maniera latente sto dicendo “ho freddo”.

Allo stesso modo sui motori di ricerca, l’utente che fa una query con delle parole chiave potrebbe voler dire la stessa cosa di un altro che cerca la stessa cosa ma in modo diverso, non esplicitando i suoi bisogni. Intercettare questi bisogni, è la chiave.

La relazione tra seo e il concetto di latente parte da un algoritmo, LDA (Latent Semantic Index), strettamente collegato a LSA (Latent Semantic Analysis) e LDA (Latent Dirichlet Allocation). Questo algoritmo infatti permette di comprendere una query anche se questa non è del tutto esplicita, grazie ad una comprensione approfondita di contesto e contenuto e all’analisi delle relazioni tra i vari termini.

Il Latent Semantic Indexing (LSI) è un metodo di indicizzazione e recupero che utilizza una tecnica matematica chiamata singular value decomposition (SVD) per identificare schemi nelle relazioni tra parole e concetti presenti in un insieme di testi non strutturati (da qui l’importanza del mark up dei testi con dati strutturati).

LSI si basa sul principio fondamentale che le parole che sono utilizzate in uno stesso contesto hanno un significato simile. Una caratteristica e funzionalità fondamentale del Latent Semantic Indexing è l’abilità di estrarre il contenuto concettuale del corpo di un testo stabilendo relazioni e associazioni tra questi termini che sono spesso presenti in contesti simili.

Un po’ come nell’esempio di bob dylan e della musica. Il Latent Semantic Indexing risolve uno dei problemi più diffusi presenti nelle query con parole chiave con variabili boleane (Vero | Falso), e cioè il problema di parole che presentano più di un significato (polisemia) oppure di parole che hanno significato simile (sinonimi). Per permettere di capire il significato di tali parole grazie al contesto, e di conseguenza di disambiguare tali termini.

L’LSI è un concetto abbastanza vecchio. Tanto che l’idea di un web semantico è presente da molto tempo. L’idea di un web semantico, infatti, esiste da molto, ed è alla base dell’evoluzione di internet. Il web semantico si basa su un concetto ondamentale, per quanto possa sembrare complicato. Questo concetto è l’associazione di diversi “concetti”, o meglio ancora “oggetti”, l’uno con l’altro.

Il web semantico si potrebbe applicare a diversi ambiti del sapere, che spaziano dall’ingegneria, alla semantica e linguistica computazionale, e quindi alla anche alla parte contenutistica della seo (ottimizzazione per i motori di ricerca).

Ad esempio, un programmatore, vede nel web semantico il modo di dare “vita” agli oggetti che ci circondano. Con il web semantico, ad esempio, un auto può accendere i tergicristalli da sé quando un sensore avverte che ha iniziato a piovere. Oppure permetterebbe di avere in casa un frigorifero “intelligente”, e così via.

Questo si sposa bene con quello che è diventato oggi Universal Analytics, di Google Analytics, che unisce le diverse piattaforme e permette di monitorare tutti gli “oggetti” collegati ad una rete internet. Un web di cose, the “web of things, not strings”.

Se questo concetto del web semantico viene applicato alla semantica, alla linguistica computazionale e al NLP (Natural Language Processing), il discorso si avvicina a quello che era il discorso iniziale del “topic latente”. Per il NLP un web semantico è un web formato da topic ed entità, semanticamente correlati tra loro, ovvero con una più o meno stretta relazione di significato che un topic può avere rispetto ad un altro.

Ecco cosa ho imparato sulla semantica e sul web semantico, e volevo condividere con voi. Cosa ne pensate? Fatemelo sapere con un commento in basso. Grazie per la lettura! 🙂

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *