Consenso all'uso dei cookies

SITO1 -- SITO2 -- Forum1 -- CercaGlobale -- Informativa su Cookie e Privacy


Valutazione discussione:
  • 0 voto(i) - 0 media
  • 1
  • 2
  • 3
  • 4
  • 5
test servizio estrazione testi da siti internet
#1
Salve a tutti!

sto cercando webmaster che siano disponibili a darmi una mano testando un nuovo servizio online di estrazione testi da siti internet.

Il servizio è nato in seguito ad un problema che dovevo risolvere: fare l'analisi grammaticale ad un sito intero. Non avevo accesso ai testi del sito e controllare le pagine una ad una era un lavoro troppo grosso. Mi sono detto che la prima cosa da fare era trovare il modo di estrarre i testi dal sito e poi passarli in un elaboratore di testi da cui lanciare il controllo ortografico.

Dopo aver trovato la soluzione, il passo successivo è stato quello di rendere pubblico il servizio: si può usare per archiviare i testi di un sito, per facilitare eventuali lavori di traduzione e, ovviamente, per l'analisi grammaticale.

Cerco persone che abbiano un loro sito internet perché saranno in grado di verificare se la scansione è stata completa o se ci sono parti mancanti. Oltre a questo vorrei verificare la corretta visualizzazione del risultato su vari sistemi operativi ed elaboratori di testo.

Il sito con il servizio è all'indirizzo www.site2txt.mrbasic.com:90/it. Nella schermata principale basta inserire il sito internet da analizzare e la mail a cui inviare il link per scaricare il risultato.

Ringrazio tutti in anticipo per l'aiuto.
Cita messaggio
Grazie da:
#2
Ciao,
ad occhio direi che manca l'informativa sulla privacy visto che l'email è trattata come dato personale in Italia...
Se debbo inserire l'email dovrei anche sapere chi e a che scopo la userà...

Per come sei entrato in questo forum tenderei quasi a consideralo spam... Vediamo...
Chi sa capire tutto è molto infelice (Maksim Gor'kij)
[Immagine: http://www.istitutomajorana.it/forum2/at...p?aid=7740]
Cita messaggio
Grazie da:
#3
(05-10-2016,20:54 )Blackstar Ha scritto: Ciao,
ad occhio direi che manca l'informativa sulla privacy visto che l'email è trattata come dato personale in Italia...
Se debbo inserire l'email dovrei anche sapere chi e a che scopo la userà...

Per come sei entrato in questo forum tenderei quasi a consideralo spam... Vediamo...

Ciao Blackstar,

la parte sulla privacy è in lavorazione. Oggi ho provato a usare EUCookieLaw ma il banner si ricarica di continuo. Giusto ora ho trovato questo sito http://ccookie.codimm.it/ che sembra interessante, anche se lo script è momentaneamente non disponibile per il download.

Ma, visto che hai introdotto l'argomento, vediamo se puoi aiutarmi con EUCookieLaw: il sito è scritto in html e pensavo di usare solo la parte dello script lato client (come illustrato in questa pagina: http://www.istitutomajorana.it/index.php...&Itemid=33). Come dicevo, il banner si ricarica di continuo indipendentemente da quale azione viene fatta sulla pagina. Suggerimenti? Serve per forza anche la parte lato server (php)?

Ho provato anche a scaricare l'ultimo versione dello script dalla pagina di github, ma a parte sembrarmi decisamente diverso da quello proposto sul sito del Majorana, continua a dare gli stessi problemi.


Ho dato un'occhiata ai post sul forum dedicati a questo script, ma non ho trovato risposta.

Se hai proposte, sono ben accette!
Cita messaggio
Grazie da:
#4
Ciao,
Non conosco i dettagli dello script ma visto che si appoggia ad un file PHP direi che ne ha bisogno.
Più che altro a questo punto dovresti essere tu a spiegare qualcosa in più Smile
Stai dicendo che un sito in HTML e Javascript può fare quello che hai descritto nel primo post? Avrebbe del miracoloso Smile

In ogni caso io non parlavo di cookies (materia fin troppo contorta per i miei gusti) ma dell'indicazione di come vengono trattati i dati inseriti e di chi ne è il responsabile.

Non prenderla per ostilità ma qui arriva un sacco di gente con intenzioni poco limpide e si deve essere prudenti.
Chi sa capire tutto è molto infelice (Maksim Gor'kij)
[Immagine: http://www.istitutomajorana.it/forum2/at...p?aid=7740]
Cita messaggio
Grazie da:
#5
Tranquilla, ho scoperto questo forum mentre facevo le ricerche sullo script per i cookie, quindi mi aspettavo l'osservazione ed avevo la risposta pronta.

Per quanto riguarda le funzionalità del sito, niente di magico: l'html è solo il front-end usato per raccogliere i dati e fornire una pagina da cui scaricare il risultato. Il lavoro "sporco" lo fa uno script bash che lancia una serie di comandi e programmi linux. Sono loro che si occupano del lavoro sporco (verifica di esistenza dell'indirizzo, scansione testuale del sito, creazione del file finale in formato testuale e invio della mail con il link per il download).

Ho scritto il post sia per testare il servizio che per capire se ci può essere un interesse pratico da parte degli utenti.
Cita messaggio
Grazie da:
#6
Dimenticavo: anche la pagina sulla privacy per il trattamento dei dati è in lavorazione. Pensavo di mettere tutto insieme con i cookie. E' da poco che ci lavoro, con il post su questo forum ho solo pensato di anticiparmi un po' per capire se la parte logica che sta dietro al sito funziona.

Se poi c'è qualche volenteroso che vuole aiutarmi ma non si fida a lasciare la mail, può creare un indirizzo mail usa e getta per l'occasione o scrivermi in privato l'indirizzo del sito da scaricare in solo testo. Mi occuperò io di far girare il programma e inviare, sempre in privato qui sul forum, il link per scaricare il file e verificare se è tutto ok.
Cita messaggio
Grazie da:
#7
In questi termini sembra una riproposizione di Httrack Smile
Cmq, benvenuto.
Chi sa capire tutto è molto infelice (Maksim Gor'kij)
[Immagine: http://www.istitutomajorana.it/forum2/at...p?aid=7740]
Cita messaggio
Grazie da:
#8
Grazie! (Httrack non fa la copia del solo testo ma di tutto il sito per poterlo navigare anche off-line. Stessa cosa si può fare con wget. Si potrebbero usare anche loro ma per avere solo il test va fatto un parsing dell'html e io non ne sono capace).

Domani faccio la pagina sulla privacy, promesso.
Cita messaggio
Grazie da:


Vai al forum:


Utenti che stanno guardando questa discussione: 1 Ospite(i)