Hur man tar bort HTML-taggar i Google Sheets
Google Ark Google Google Docs Hjälte / / June 08, 2023
Publicerad
Om du kopierar data från webbsidor till Google Sheets kan det innehålla mycket oönskad HTML-kod. Så här tar du bort HTML-taggar i Google Sheets.
Google Kalkylark är ett utmärkt sätt att organisera och analysera data. Som alla bra mjukvaror är skräp in lika med skräp ut. Om du hämtar din data från andra källor kan du få mer än du hade räknat med; du kan oavsiktligt importera den information du vill ha men också en massa värdelösa HTML-taggar. Tills du blir av med dessa taggar kommer du inte att kunna göra mycket med din data.
Tack och lov är det inte så svårt att ta bort alla dessa HTML-taggar och bara lämna den information du vill ha. Så här tar du bort HTML-taggar i Google Sheets.
Vad är HTML-taggar?
HTML-taggar är en del av HTML-koden (HyperText Markup Language) som talar om för en webbläsare hur den ska visa innehållet i dessa taggar. En HTML-tagg kan till exempel tala om för din webbläsare att visa en textavsnitt i fetstil eller kursiv stil, eller att rikta in texten till mitten eller skapa en ram där innehåll kan bäddas in.
Dessa HTML-taggar har alltid samma format. De börjar med namnet på taggen inom vinkelparenteser, som t.ex
När du kopierar data från en webbsida, såväl som de värden du vill kopiera, kan du också oavsiktligt kopiera dessa HTML-taggar. Dessa är inte användbara för dig i ditt kalkylblad, så du vill ta bort dem och bara lämna den information du faktiskt vill ha.
Hur man tar bort HTML-taggar i Google Sheets med hjälp av en formel
Du kan skapa en formel som kommer att titta på en cell, ta bort alla dess HTML-taggar och returnera allt som är kvar. Den ursprungliga cellen kommer att förbli orörd, men den nya cellen kommer att ta bort alla HTML-taggar, vilket bara lämnar den data du vill ha. Du kan skapa den här formeln för en cell och sedan snabbt tillämpa den på flera celler.
Så här tar du bort HTML-taggar med en formel i Google Kalkylark:
- Markera cellen bredvid din första cell som innehåller HTML-taggar.
- Skriv följande:
=REGEXREPLACE(
- Välj cellen som innehåller din HTML.
- Skriv ett kommatecken och sedan:
"]+>","")
- Tryck Stiga på och HTML-taggarna ska tas bort från dina data.
- För att tillämpa formeln på andra celler, klicka och håll ned draghandtaget i cellens nedre hörn.
- Dra nedåt över cellerna som du vill kopiera formeln till.
- Släpp och formeln kopieras till dessa celler och tar bort HTML-taggarna från dina återstående data.
Denna formel fungerar genom att använda REGEXERSÄT fungera. Denna funktion låter dig ersätta en del av en sträng med en annan sträng. Du tillhandahåller texten som ska ersättas genom att markera cellen som innehåller HTML-taggarna.
Du anger sedan ett reguljärt uttryck som funktionen kommer att söka efter. I det här fallet är det reguljära uttrycket:
]+>
Detta uttryck letar efter en sträng som börjar med en öppen vinkelparentes, innehåller minst ett tecken som inte är en vinkelparentes och slutar med en stängd vinkelparentes. Som vi såg tidigare, eftersom alla HTML-taggar börjar och slutar med vinkelparenteser, kommer detta reguljära uttryck att hitta alla instanser av dessa taggar.
Den sista delen av formeln ersätter alla instanser av matchningar för det reguljära uttrycket med ingenting alls. Eftersom alla HTML-taggar ersätts med ingenting, är allt som återstår den återstående texten.
Hur man tar bort HTML-taggar i Google Sheets med hjälp av Sök och ersätt
En nackdel med den här metoden är att även om den kommer att ta bort HTML-taggarna från dina data, skapar den en ny kolumn med data och lämnar dig fortfarande med den ursprungliga taggade datan också. Om du raderar originaldata försvinner även de nya avskalade värdena, eftersom formeln inte har något att arbeta på.
Du kan kopiera och klistra in dina data som värden, men det här är inte idealiskt. Ett alternativ är att använda Sök och ersätt för att ta bort HTML-taggarna från dina celler och lämna resultatet i samma cell.
Så här tar du bort HTML-taggar med Sök och ersätt i Google Kalkylark:
- Klicka på Redigera meny.
- Välj Hitta och ersätta.
- I den Hitta fältet, ange samma reguljära uttryck som vi använde i vår formel:
]+>
- Se till att Sök med reguljära uttryck är markerad, eftersom annars sök och ersätt efter den exakta texten i vårt reguljära uttryck.
- Klick Ersätt alla.
- HTML-taggarna bör försvinna och bara innehålla den data du vill ha.
Läs mer om Google Sheets
Att lära sig hur du tar bort HTML-taggar i Google Sheets säkerställer att du inte behöver slösa timmar på att manuellt redigera all din data för att ta bort de oönskade taggarna. Med någon av metoderna ovan kan du snabbt bli av med taggarna och bara lämna den data du behöver. Möjligheten att använda reguljära uttryck är en riktig livräddare här; det är definitivt värt att lära sig mer om RegEx, eftersom det kan spara mycket tid.
Det finns många andra användbara tips och tricks från Google Sheets som du kan lära dig. Om du försöker spåra tid kan du lära dig hur man använder tidsstämplar i Google Sheets. Om dina formler inte ger dig de resultat du vill ha kan du lära dig hur man visar formler i Google Sheets så att du kan kontrollera dem för fel. Och om du vill använda data från ett annat dokument kan du lära dig hur du gör fråga ett annat ark i Google Kalkylark.