venerdì 12 ottobre 2012

Come trovare i documenti PDF (e non solo) con Google




Google è un potentissimo motore di ricerca ma spesso spendiamo molto tempo alla ricerca di un file e ci perdiamo tra le varie pagine dei risultati senza trovare quello che stavamo cercando e dopo le prime pagine quasi sicuramente ci arrendiamo. Tuttavia non tutti sanno che è possibile sfruttare alcuni comandi ovvero una specifica sintassi per  filtrare i risultati di ricerca proposti.
Ad esempio è possibile cercare i termini che vi interessano esclusivamente all’interno dei file PDF indicizzati su Google, in questo modo vi verranno proposti solamente i documenti PDF che vi interessano, escludendo siti ed altri tipi di file.
La sintassi che indica a Google di cercare solamente all’interno dei file PDF è Filetype, quindi se per esempio state cercando dei documenti che contengono “la divina commedia”  dovrete inserire il seguente comando all’interno del box di ricerca:

“la divina commedia” filetype:pdf   (comprese le virgolette)
In questo modo tutti i risultati di ricerca saranno file PDF che contengono le informazioni cercate. Il comando Filetype non funziona solamente con i PDF, può essere utilizzato anche con tutti gli altri tipi di file, esempi:

Cercare all’interno di file Word:
“la divina commedia” filetype:doc

Cercare all’interno file di PowerPoint:
“la divina commedia” filetype:ppt

Cercare all’interno di semplici file testo:
“la divina commedia” filetype:txt

Come avete già capito basta inserire l’estensione del file interessato dopo il comando Filetype.
Per cercare un documento PDF all'interno di un sito preciso occorre aggiungere alla chiave di ricerca precedentemente utilizzata, la sintassi inurl:sitoweb.com sostituendo a sitoweb.com il sito in cui volete cercare. La stringa di ricerca risultante sarà la seguente:

“la divina commedia” inurl:sitoweb.com filetype:pdf


Revlin

Convertire file PDF (pdf immagine o testo) in DOC con Google Docs

                   
Il PDF è uno dei formati più utilizzati per la condivisione dei documenti. Molto spesso si ha la necessità di editare questo tipo di file che può essere costituito da testo e/o immagini selezionabili o da testo e immagini non selezionabili. Nel caso in cui il PDF contenga testo selezionabile non c’è bisogno di conversione poiché possiamo selezionare tutto il testo manualmente (apriamo il PDF, tasto destro del mouse, ‘strumento seleziona’), quindi copiare tutto manualmente su un editor  Word; da premettere che ci sono comunque molti software gratuiti che fanno l’ estrazione del testo automaticamente (con testo selezionabile).
Le cose si complicano se dobbiamo estrarre tutto il testo da un PDF in cui il testo non è selezionabile e tutto appare come se fosse un’ unica immagine, un esempio di questo tipo di PDF sono quelli che si ottengono in seguito ad una scansione.
In questo caso i software gratuiti che si trovano sul web nella maggior parte dei casi non fanno bene il loro lavoro in quanto non riescono a riconoscere il testo o lo fanno solo in parte. A meno che non vogliamo spendere soldi per comprare qualche software che effettui decentemente la conversione possiamo utilizzare Google Docs, uno dei tanti strumenti gratuiti messi a disposizione da Google.
Google Docs,  grazie all’OCR (Optical Character Recognition), è in grado di leggere il testo presente in una immagine e salvarlo direttamente in .TXT o PDF.

Vediamo come procedere:
Per utilizzare Google Docs, così come la maggior parte dei servizi di Google bisogna avere un account.
Per iniziare è necessario loggarsi con il proprio account su Google Docs e qui troverete, sulla sinistra, il riferimento ai vostri documenti, oltre che il bottone per caricarne altri; una volta premuto su quest’ultimo vi si chiederà di caricare un file presente sul vostro PC e qui, bisogna effettuare un’operazione aggiuntiva, per modificare i file in PDF e renderli ‘editabili’.

Se l’upload ha avuto successo (è possibile caricare PDF fino a 2MB) troverete immediatamente il file tra i vostri documenti Google Docs, oltretutto con stesso nome e formato;
premendo per visualizzarlo verrà aperto all’interno di un editor grazie al quale è possibile apportare modifiche e aggiunte.
Successivamente sarà possibile scaricare il file, debitamente modificato, nel formato che preferite tra quelli disponibili, ottenendo magari un .doc a partire da un .pdf.
Naturalmente il risultato che si andrà ad elaborare sarà testo semplice,  privo cioè di qualunque tipo di formattazione.

Revlin