obv wat hier gepost, mijn voornaamste reden om dit te maken is omdat ik een excuus zoek om Algolia ( https://www.algolia.com/ ) eens te proberen.quote:Op dinsdag 31 mei 2016 12:55 schreef cablegunmaster het volgende:
[..]
Oh is de huidige implementatie van jou? Of bouw je zelf een systeem ernaast? Naar aanleiding van de gegeven gegevens op dit topic?
Hoe bevalt Algolia tot nu toe?quote:Op dinsdag 31 mei 2016 18:14 schreef TwenteFC het volgende:
[..]
obv wat hier gepost, mijn voornaamste reden om dit te maken is omdat ik een excuus zoek om Algolia ( https://www.algolia.com/ ) eens te proberen.
Ik werk tegenwoordig bijna alleen nog maar met Laravel.
Ben eerst het "saaie" spul aan het maken, anders gaat het project /dev/null nadat ik met de search klaar ben. Zal wanneer het af is 't project wel op github gooien en dan kan djkoelkast het gebruiken en anderen verbeteringen pushen.quote:
Ziet er leuk uit , beetje overkill denk ik?quote:Op dinsdag 31 mei 2016 18:14 schreef TwenteFC het volgende:
[..]
obv wat hier gepost, mijn voornaamste reden om dit te maken is omdat ik een excuus zoek om Algolia ( https://www.algolia.com/ ) eens te proberen.
Ik werk tegenwoordig bijna alleen nog maar met Laravel.
Volstrekte overkill natuurlijk, maar het is ook meer een PoCje voor zover ik begrijp. Iets dergelijks wordt pas echt interessant als je wat grotere en diverse collecties documenten / objecten krijgt.quote:Op woensdag 1 juni 2016 14:42 schreef cablegunmaster het volgende:
[..]
Ziet er leuk uit , beetje overkill denk ik?
Dat is altijd leuk . Vroeg me al af wat voor servers eigenlijk gebruik van maken, zie google zoiets al weg gebruiken maar op welk niveau je zoiets nodig zou moeten hebben weet ik niet. (aangezien de kosten).quote:Op woensdag 1 juni 2016 15:01 schreef Monolith het volgende:
[..]
Volstrekte overkill natuurlijk, maar het is ook meer een PoCje voor zover ik begrijp. Iets dergelijks wordt pas echt interessant als je wat grotere en diverse collecties documenten / objecten krijgt.
Al is het natuurlijk wel aardig dat er wat basale correctie op de zoekinput zit, ongetwijfeld zaken als stemfiltering, edit distance, synonyms, stopwords etcetera waardoor het nog net wat meer functionaliteit biedt dan een simpele 'LIKE' in MySQL.
Search technologie wordt wel redelijk breed ingezet. Meestal iets Lucene based zoals ElasticSearch of SOLR.quote:Op woensdag 1 juni 2016 17:09 schreef cablegunmaster het volgende:
[..]
Dat is altijd leuk . Vroeg me al af wat voor servers eigenlijk gebruik van maken, zie google zoiets al weg gebruiken maar op welk niveau je zoiets nodig zou moeten hebben weet ik niet. (aangezien de kosten).
Ik werk inderdaad bij een groothandel met een zakelijke webshop, de voornaamste punten waarom ik Algolia interessant vind.quote:Op woensdag 1 juni 2016 17:14 schreef Monolith het volgende:
[..]
Search technologie wordt wel redelijk breed ingezet. Meestal iets Lucene based zoals ElasticSearch of SOLR.
Bij een beetje webshop met een flink assortiment wil je bijvoorbeeld natuurlijk de optie bieden om makkelijk te zoeken naar producten. Aan die producten zitten een hoop aspecten (naam, omschrijving, categorie met eventueel subcategorieën, maten, merk, enzovoort). Je wilt dan zoekresultaten geven die eigenlijk zoeken in al dat soort aspecten, maar daarbij wel weer relevantiescores kunnen hanteren zodat je bijvoorbeeld een match op productnaam zwaarder kunt wegen dan op productomschrijving. Ook allerhande zaken die ik aanhaalde als spelcorrectie / suggestie, stemming waardoor het niet uitmaakt of je bijvoorbeeld op 'fiets' of 'fietsen' zoekt, enzovoort zijn dan handig.
Voor dat soort zaken is SQL fulltext search niet echt geschikt.
Het lijkt inderdaad wel een leuke dienst, al denk ik toch wel dat je het nodige zult moeten ontwikkelen qua feeding en later eventueel allerhande optimalisatie / customization. ElasticSearch en SOLR werken ook wel vrij eenvoudig out of the box als je er kennis van hebt, hoewel dat voor veel mensen wel even een zekere leercurve zal zijn.quote:Op woensdag 1 juni 2016 18:13 schreef TwenteFC het volgende:
[..]
Ik werk inderdaad bij een groothandel met een zakelijke webshop, de voornaamste punten waarom ik Algolia interessant vind.
- Geen ontwikkelingskosten naast de implementatie
- Faceted & fuzzy search
1 2 3 4 5 | <tr id="CF-7-ShowRow"> <td class="label">Some text</td> <td class="value"> Dit is wat ik eruit wil halen</td> </tr> |
Waarom zou je hier een regex willen gebruiken? Html is nou niet bepaald regulier. Met DOMDocument moet je meer kunnen doen, die is speciaal ontwikkeld om met xml en html om te kunnen gaan.quote:Op maandag 6 juni 2016 16:05 schreef xaban06 het volgende:
Ik heb een stukje HTML, waar ik bepaalde informatie uit wil halen. Zie de HTML code hieronder en zie ook wat ik er uit wil halen.
Dit zou met regular expressions kunnen, maar ik heb er zoveel over gelezen, maar ik kan gewoon geen reg exp maken, helaas.
Dus los ik het op met explode op <tr id="CF-7-ShowRow">, vervolgens een explode op <td class="value">, etc.
Zou iemand mij willen helpen
[ code verwijderd ]
Yup.quote:Op maandag 6 juni 2016 20:41 schreef Light het volgende:
[..]
Waarom zou je hier een regex willen gebruiken? Html is nou niet bepaald regulier. Met DOMDocument moet je meer kunnen doen, die is speciaal ontwikkeld om met xml en html om te kunnen gaan.
Dat is een feature!quote:Op maandag 13 juni 2016 18:25 schreef d4v1d het volgende:
Mijn Python begint opeens PHP te schrijven? Is dit een bug?
[ afbeelding ]
Als je dan echt flauwe Pythongrappen wil maken is het eigelijk 'begint plots PHP te schrijven'.quote:Op maandag 13 juni 2016 18:25 schreef d4v1d het volgende:
Mijn Python begint opeens PHP te schrijven? Is dit een bug?
[ afbeelding ]
ECMAScript is de standaard voor een paar talen, JavaScript, JScript en ActionScript. Dit is een blauwdruk met een hele set aan afspraken over hoe de taal moet werken. JavaScript is dus een implementatie van de regels van ECMAScript, net als JScript en ActionScript.quote:Op maandag 20 juni 2016 14:37 schreef cablegunmaster het volgende:
Vraagje is Ecmascript een subset van Javascript? De uitleg van Wikipedia vond ik verwarrend.
Iets met eerst was het Javascript conform naar Ecma script en dan weer conform de regels van Ecmascript is javascipt een subset taal gebaseerd op Ecmascript (ECMA-262?)
*verwart*
Bedankt ! dit verheldert een hele hoop.quote:
Ik weet dat in ieder geval in WordPress er een aparte functie is om te kijken of een folder onder windows schrijfbaar is: https://developer.wordpre(...)ons/win_is_writable/quote:Op vrijdag 9 september 2016 09:32 schreef Darkomen het volgende:
*kuch* STOF *kuch*
Where my PHPeeps at?!
Bij een klant van mij heb ik het probleem dat is_writeable() aangeeft dat een folder niet schrijfbaar is, maar ik kan wel nieuwe bestanden in de folders plaatsen?
IIS users hebben volledige rechten op de folders, iemand een idee?
PHP Version 5.5.34
Windows Server 2012 R2 Datacenter Edition i586
Ik doe iets vergelijkbaars, ik kijk eerst of de directory schrijfbaar is, zo ja, prima.quote:Op vrijdag 9 september 2016 09:53 schreef Rockfire het volgende:
[..]
Ik weet dat in ieder geval in WordPress er een aparte functie is om te kijken of een folder onder windows schrijfbaar is: https://developer.wordpre(...)ons/win_is_writable/
Altijd een goede oplossing,echter had deze client een eigen windows server. (van vroeger)quote:
weet je ook zeker dat php rechten heeft op die folder?quote:Op vrijdag 9 september 2016 09:32 schreef Darkomen het volgende:
*kuch* STOF *kuch*
Where my PHPeeps at?!
Bij een klant van mij heb ik het probleem dat is_writeable() aangeeft dat een folder niet schrijfbaar is, maar ik kan wel nieuwe bestanden in de folders plaatsen?
IIS users hebben volledige rechten op de folders, iemand een idee?
PHP Version 5.5.34
Windows Server 2012 R2 Datacenter Edition i586
weet je ook zeker dat php onder iis users valt en niet zijn eigen user is?quote:Op dinsdag 13 september 2016 08:27 schreef Darkomen het volgende:
Yup, voor zover ik van dit van iis weet.
Alle users in de groep iis_users hebben volledige rechten tot de folder.
En, is die al resistent tegen golunksi's exploit of brengen ze hem gewoon uit met known zero-days die ze in oktober misschien een keer gaan patchen?quote:Op donderdag 15 september 2016 09:21 schreef Aether het volgende:
The MySQL 8.0.0 Milestone Release is available.
Dit is geen productieversiequote:Op vrijdag 16 september 2016 09:30 schreef KomtTijd... het volgende:
[..]
En, is die al resistent tegen golunksi's exploit of brengen ze hem gewoon uit met known zero-days die ze in oktober misschien een keer gaan patchen?
quote:https://news.ycombinator.com/item?id=12481348
• morgo 3 days ago
Product Manager for the MySQL Server here. Happy to answer questions!
• hdjjhhvvhga 3 days ago
Does this release have the recent SQL code execution bug patched?
• morgo 3 days ago
No.
quote:• v64 3 days ago
The latest stable release of MySQL is 5.7, no? Why the jump to 8.0?
• morgo 3 days ago
6.0 was a canceled release. 7.x. is used by Cluster. 8.0 makes it easy to follow as "it just drops the 5".
Ik zie geen straatnaam/huisnummer los van elkaar staan in de demo die je daar geeft.quote:Op maandag 5 december 2016 18:29 schreef TwenteFC het volgende:
Topic weer even tot leven wekken omdat het kan.
Waarom maken (grote) bedrijven api's die gewoon debiel werken?
https://scm.commerceinterface.com/api-doc/v3/#endpoint
Heb het genot om hier mee te werken en dan krijg je een adres i.t.t. de demo terug als "Straatnaam huisnummer" in één veld terwijl je het later voor de adreslabel weer uit elkaar mag trekken.. sommige mensen.. kunnen wij adressen straks alsnog handmatig gaan controleren als er weer een "2e Straatnaam 1944 13-A 3e verdieping van onder" tussenzit. fml.
Dat is nog het ergste, in de demo niet nee. Bij hen in productie wel.quote:Op dinsdag 6 december 2016 08:58 schreef Scarlet_Dragonfly het volgende:
[..]
Ik zie geen straatnaam/huisnummer los van elkaar staan in de demo die je daar geeft.
Daarnaast vraag ik me af waarom je ze weer los van elkaar wilt trekken? Hoe/waar ga je dat voor gebruiken? Ga je dan zelf ook rekening houden met adressen waar het huisnummer vóór de straatnaam staat (zoals in de VS)?
Ze geven aan dat er 2 regels voor het adres beschikbaar zijn, address1 en address2. Dat in de ene in het voorbeeld alleen het huisnummer staat en in de andere de straatnaam, lijkt me toeval. Ze moeten toch iets om in het voorbeeld beide adresregels te gebruiken.quote:Op maandag 5 december 2016 18:29 schreef TwenteFC het volgende:
Topic weer even tot leven wekken omdat het kan.
Waarom maken (grote) bedrijven api's die gewoon debiel werken?
https://scm.commerceinterface.com/api-doc/v3/#endpoint
Heb het genot om hier mee te werken en dan krijg je een adres i.t.t. de demo terug als "Straatnaam huisnummer" in één veld terwijl je het later voor de adreslabel weer uit elkaar mag trekken.. sommige mensen.. kunnen wij adressen straks alsnog handmatig gaan controleren als er weer een "2e Straatnaam 1944 13-A 3e verdieping van onder" tussenzit. fml.
Ze doen ook wel iets, address1 op "Straatnaam 11a" zetten en address2 op null zetten.quote:Op woensdag 7 december 2016 21:21 schreef Light het volgende:
[..]
Ze geven aan dat er 2 regels voor het adres beschikbaar zijn, address1 en address2. Dat in de ene in het voorbeeld alleen het huisnummer staat en in de andere de straatnaam, lijkt me toeval. Ze moeten toch iets om in het voorbeeld beide adresregels te gebruiken.
Ik heb geen idee wat ze doen, en of ze überhaupt om verschillende velden vragen. Maar je zou natuurlijk bij de aanbieder van de API kunnen informeren of ze huisnummer apart hebben en kunnen aanleveren. Het kan als extra veld, dus dat zou verder geen impact mogen hebben.quote:Op donderdag 8 december 2016 18:20 schreef TwenteFC het volgende:
[..]
Ze doen ook wel iets, address1 op "Straatnaam 11a" zetten en address2 op null zetten.
Vandaar ook dat het mij irriteert, en wat het erger maakt is dat ik 100% zeker weet dat ze het zelf los opslaan ergens.
Een regex is vrij simpel, gewoon .+quote:Op donderdag 8 december 2016 18:41 schreef Nattekat het volgende:
Ik heb ooit een regex mogen maken die rekening moest houden met alle uitzonderingen die er zijn. Nog steeds glipt er af en toe een hele rare doorheen
Nou scheelt het gelukkig dat 99% van de adressen gewoon "straatnaam huisnummer toevoeging" zijn.
quote:Op donderdag 8 december 2016 18:48 schreef Monolith het volgende:
[..]
Een regex is vrij simpel, gewoon .+
Spelfouten zijn niet zo erg. Het is onderdeel van een systeem dat gegevens uit een lijst met verpakte orders haalt en vervolgens op de site van de vervoerder alle velden invult. Die site filtert de eventuele stijlfouten er wel uit, en dan moet het ook nog door en persoon daadwerkelijk verzonden worden.quote:Voor validatie of extractie lijkt een regex mij nou niet bepaald de meest geschikte optie.
Als je wilt weten of iets een geldig adres is of er onderdelen uit wilt extraheren, dan kun je beter iets van een search engine of iets dergelijks gebruiken. Ook i.v.m. spelfouten en dergelijke.
Bezig met een gelijksoortig iets, van de api die ik hierboven postte direct door naar de CIF Api van PostNL.Ik zie dat ze sinds kort een nieuw veld hebben "StreetHouseNrExt" dus ik speel hem gewoon direct door nu. Af en toe een boete vanwege een incorrect adres is goedkoper dan alles controleren.quote:Op donderdag 8 december 2016 18:55 schreef Nattekat het volgende:
[..]
[..]
Spelfouten zijn niet zo erg. Het is onderdeel van een systeem dat gegevens uit een lijst met verpakte orders haalt en vervolgens op de site van de vervoerder alle velden invult. Die site filtert de eventuele stijlfouten er wel uit, en dan moet het ook nog door en persoon daadwerkelijk verzonden worden.
Voor wat het moet doen, werkt het perfect.
Al gedaan maar was "technisch niet mogelijk" (wat ik altijd een onzin antwoord vind), maarja dan houdt het op.quote:Op donderdag 8 december 2016 18:25 schreef Light het volgende:
[..]
Ik heb geen idee wat ze doen, en of ze überhaupt om verschillende velden vragen. Maar je zou natuurlijk bij de aanbieder van de API kunnen informeren of ze huisnummer apart hebben en kunnen aanleveren. Het kan als extra veld, dus dat zou verder geen impact mogen hebben.
Als het doet wat het moet doen is het prima natuurlijk.quote:Op donderdag 8 december 2016 18:55 schreef Nattekat het volgende:
[..]
[..]
Spelfouten zijn niet zo erg. Het is onderdeel van een systeem dat gegevens uit een lijst met verpakte orders haalt en vervolgens op de site van de vervoerder alle velden invult. Die site filtert de eventuele stijlfouten er wel uit, en dan moet het ook nog door en persoon daadwerkelijk verzonden worden.
Voor wat het moet doen, werkt het perfect.
Die regex moet de staat, huisnummer en toevoeging onderscheiden. Dat lijkt me wel een belangrijke eerste stap voor je het in wat voor api dan ook gaat gooien.quote:Op donderdag 8 december 2016 19:06 schreef Monolith het volgende:
[..]
Als het doet wat het moet doen is het prima natuurlijk.
Vaak zie je bij adressen echter dat het belangrijk is om ook te controleren of het een bestaand adres is en / of wat de bijbehorende locatie / postcode is. Dan is een regex doorgaans niet het juiste middel.
Dat is gewoon marketingjargon voor "we willen het niet of we kunnen het niet" jaquote:Op donderdag 8 december 2016 19:04 schreef TwenteFC het volgende:
[..]
Al gedaan maar was "technisch niet mogelijk" (wat ik altijd een onzin antwoord vind), maarja dan houdt het op.
Dat kan, maar als je de boel ik een Lucene index gooit en bijvoorbeeld kijkt naar de Levenshtein distance, dan kun je wel matchen en het daadwerkelijke adres achterhalen. Kun je ook nog allerhande andere tokenization hanteren voor meer opties.quote:Op donderdag 8 december 2016 19:09 schreef Nattekat het volgende:
[..]
Die regex moet de staat, huisnummer en toevoeging onderscheiden. Dat lijkt me wel een belangrijke eerste stap voor je het in wat voor api dan ook gaat gooien.
Aan de andere kant heb je te maken met een Amerikaanse(?) organisatie die waarschijnlijk de hele wereld als marktgebied wil. Waarom zou je dan een apart veld maken voor huisnummer? En, zoals ik al aangaf, ik heb geen idee hoe ze het adres aan de (Nederlandse) bezoekers vragen. Als ze gewoon invulveldjes hebben voor 2 adresregels, dan hebben ze de data niet gescheiden.quote:Op donderdag 8 december 2016 19:04 schreef TwenteFC het volgende:
[..]
Bezig met een gelijksoortig iets, van de api die ik hierboven postte direct door naar de CIF Api van PostNL.Ik zie dat ze sinds kort een nieuw veld hebben "StreetHouseNrExt" dus ik speel hem gewoon direct door nu. Af en toe een boete vanwege een incorrect adres is goedkoper dan alles controleren.
Maar ik blijf het raar vinden want dit is ook niet het eerste bedrijf dat dit flikt.
[..]
Al gedaan maar was "technisch niet mogelijk" (wat ik altijd een onzin antwoord vind), maarja dan houdt het op.
quote:Op donderdag 8 december 2016 20:58 schreef Light het volgende:
[..]
Aan de andere kant heb je te maken met een Amerikaanse(?) organisatie die waarschijnlijk de hele wereld als marktgebied wil. Waarom zou je dan een apart veld maken voor huisnummer? En, zoals ik al aangaf, ik heb geen idee hoe ze het adres aan de (Nederlandse) bezoekers vragen. Als ze gewoon invulveldjes hebben voor 2 adresregels, dan hebben ze de data niet gescheiden.
Dan lijkt het er idd op dat ze straat en huisnummer apart opslaan. En dan moeten ze het ook apart kunnen aanleveren.quote:
Er is een aparte invoer. Zegt niet direct iets over de de opslag.quote:Op donderdag 8 december 2016 21:09 schreef Light het volgende:
[..]
Dan lijkt het er idd op dat ze straat en huisnummer apart opslaan. En dan moeten ze het ook apart kunnen aanleveren.
Forum Opties | |
---|---|
Forumhop: | |
Hop naar: |